Comment trouver et supprimer les doublons dans Excel ?
Microsoft Excel est une application largement utilisée, mais elle peut être un peu déroutante lorsqu’il s’agit de supprimer et d’éliminer les données en double. La suppression des doublons dans Excel est une tâche courante pour les personnes qui travaillent sur d’énormes ensembles de données. Lorsque vous combinez différents tableaux, ou lorsque plusieurs personnes ont accès au même document, vous pouvez finir par avoir des entrées répétées dans votre feuille de calcul. Ainsi, les données deviennent redondantes. Plus l’ensemble de données est important, plus les risques de rencontrer des enregistrements en double sont élevés. Cela peut être problématique s’ils ne sont pas identifiés et traités correctement.
Nous allons illustrer comment supprimer les doublons dans Excel en utilisant un jeu de données sur les sports. Ce jeu de données contient des informations sur les médaillés olympiques pour l’année 2012.
Les données dupliquées sont parfois utiles, mais elles rendent souvent les données plus difficiles à comprendre. Il est préférable de trouver, de mettre en évidence et d’examiner les doublons avant de les supprimer que de les supprimer d’emblée.
Table des matières
Comment supprimer les valeurs en double dans Excel
Excel dispose d’un outil intégré qui permet de supprimer les entrées répétées dans votre ensemble de données. Voyons maintenant les étapes à suivre pour supprimer les doublons dans Excel.
- Étape 1 : Tout d’abord, cliquez sur une cellule ou une plage spécifique de l’ensemble de données dont vous souhaitez supprimer les doublons. Si vous cliquez sur une seule cellule, Excel détermine automatiquement la plage pour vous à l’étape suivante.
commande_suppression_duplicata_1-RemoveDuplicatesInExcel - Étape 2 : Ensuite, localisez l’option » Supprimer les doublons » et sélectionnez-la.
Onglet DONNÉES → Section Outils de données → Supprimer les doublons - Étape 3 : une boîte de dialogue apparaît, comme illustré ci-dessous. Vous pouvez sélectionner les colonnes que vous souhaitez comparer et vérifier si elles contiennent des données en double.
Si vos données sont constituées d’en-têtes de colonnes, sélectionnez l’option « Mes données ont des en-têtes », puis cliquez sur OK. Si vous cochez l’option d’en-tête, la première ligne ne sera pas prise en compte pour la suppression des doublons. - Étape 4 : Excel va maintenant supprimer les lignes en double et afficher une boîte de dialogue. Cette boîte de dialogue affiche un résumé du nombre de valeurs en double trouvées et supprimées, ainsi que le nombre de valeurs uniques.
commande_suppression_duplicata_4 - Étape 5 : Comme vous pouvez le constater, les enregistrements en double ont été supprimés.
Poursuivons et comprenons comment supprimer les doublons dans Excel en utilisant l’option Filtre avancé.
Comprendre le filtrage des valeurs uniques ou la suppression des doublons
Dans le but d’obtenir une liste de valeurs uniques, vous pouvez soit filtrer les valeurs uniques, soit supprimer les valeurs en double. Ces tâches ont un objectif commun. Toutefois, il existe une différence essentielle. Lors du filtrage des valeurs uniques, les valeurs en double sont temporairement masquées, tandis que l’option de suppression des valeurs en double supprime définitivement les valeurs en double.
En outre, il est essentiel de comprendre qu’une comparaison de valeurs en double repose sur ce qui apparaît dans la cellule plutôt que sur la valeur sous-jacente contenue dans la cellule. Par exemple, si deux cellules contenant la même valeur de date sont formatées comme « 3/9/2022 » et « 9 mars 2022 », elles sont considérées comme deux valeurs uniques.
Par conséquent, prenez l’habitude de vérifier avant de supprimer les doublons. Essayez de filtrer ou de formater de manière conditionnelle les valeurs uniques pour obtenir les résultats escomptés.
Filtrer les valeurs uniques
Suivez les étapes suivantes pour filtrer les valeurs uniques :
Commencez par sélectionner la plage de cellules. Vous devrez vous assurer que la cellule active se trouve dans un tableau.
Ensuite, vous devez localiser et sélectionner l’option de filtre avancé dans le groupe Tri et filtre.
Onglet Données → Section Tri et filtre → Avancé.
Option de tri et de filtrage
La fenêtre contextuelle du filtre avancé s’affiche sur votre écran. Vous pouvez effectuer l’une des actions suivantes :
- Si vous devez filtrer la plage de cellules/tables en place, cliquez sur Filtrer la liste en place.
- Si vous devez copier les résultats du filtre à un autre endroit, prenez les mesures suivantes :
- Cliquez sur l’option « Copier vers un autre emplacement » pour copier les valeurs.
- Dans la case « Copier vers », entrez une référence de cellule où les valeurs résultantes doivent être copiées.
- Vous pouvez temporairement cliquer sur l’option « Réduire la boîte de dialogue » ( ) pour masquer la fenêtre contextuelle. Ensuite, une fois que vous avez sélectionné une cellule de la feuille de calcul, cliquez sur l’option « Développer » ( ).
- Cochez la case « Enregistrements uniques uniquement », puis cliquez sur OK.
Utilisation de l’option de filtre avancé
L’option Filtre avancé d’Excel vous permet de filtrer les valeurs en double et de copier les valeurs uniques à un autre emplacement. Suivez les étapes suivantes pour découvrir comment fonctionne l’option Filtre avancé.
Tout d’abord, cliquez sur une cellule ou une plage de l’ensemble de données dont vous souhaitez supprimer les doublons. Si vous cliquez sur une seule cellule, Excel détermine automatiquement la plage lorsque vous cliquez sur Filtre avancé.
Localisez l’option de filtre avancé.
Onglet DONNÉES → section Tri et filtre → Avancé et cliquez dessus.
Vous verrez apparaître une boîte de dialogue. Elle consiste en une liste d’options de filtrage avancé.
Sélectionnez l’option ‘Copier vers un autre emplacement’ pour copier les valeurs uniques vers un autre emplacement.
- Vérifiez la plage de vos enregistrements dans le champ « List Range » et assurez-vous qu’il s’agit bien de la plage que vous avez spécifiée.
- Dans le champ « Copy to : », saisissez la plage dans laquelle les valeurs uniques résultantes doivent être copiées.
- Cochez la case « Enregistrements uniques uniquement ». Cette étape est la plus importante.
- Cliquez sur OK
Les valeurs uniques seront copiées dans la cellule G1.
Ce sont les fonctionnalités intégrées dans Excel qui nous aident à supprimer les doublons. Maintenant, allons de l’avant et apprenons comment nous pouvons créer notre propre fonction pour faire la même chose.
Comment utiliser les formules pour supprimer les doublons dans Excel ?
Nous allons utiliser un exemple simple contenant les colonnes : type de sport, nom de l’athlète et médaille gagnée pour démontrer cette approche.
Cette méthode consiste à combiner les colonnes à l’aide d’une formule Excel et à obtenir le compte. Nous allons ensuite filtrer les valeurs en double (celles dont le nombre est supérieur à 1).
Combinons les colonnes A, B et C en utilisant l’opérateur de concaténation « & ». Ainsi, la formule Excel serait la suivante
=A2&B2&C2
Cette formule est saisie dans la cellule D2, puis copiée sur toutes les lignes.
Maintenant, nous avons besoin d’une autre colonne appelée « Compte » pour trouver les doublons dans la colonne D. Nous utilisons donc la fonction COUNTIF dans la cellule E2. La formule sera la suivante
=COUNTIF($D$2:D2,D2)
Cette formule permet de compter le nombre d’occurrences de chaque valeur dans la colonne D.
Si la valeur de Count est « 1 », alors la valeur n’est apparue qu’une seule fois et est unique. Si la valeur est « 2 » ou plus, alors elle est considérée comme une valeur dupliquée.
Ajoutez maintenant un filtre à la colonne Count en sélectionnant l’option Filter.
Vous la trouverez dans l’onglet DONNÉES → section Tri et filtre → Filtre.
Cliquez sur le filtre en haut de la colonne E. Sélectionnez « 1 » pour ne garder que les valeurs uniques et supprimer les doublons.
En cliquant sur OK, les valeurs en double seront supprimées du tableau. Vous pouvez copier ces enregistrements uniques résultants et les coller ailleurs.
Poursuivons en comprenant l’approche finale pour supprimer les doublons : L’utilisation de Power Query.
Problèmes de suppression des doublons à partir de données soulignées ou sous-totalisées
Un problème courant lors de la suppression des doublons est que vous ne pouvez pas supprimer les valeurs en double des données soulignées ou sous-totalisées. Pour supprimer les doublons, vous devez supprimer à la fois le contour et les sous-totaux.
Formatage conditionnel des valeurs uniques ou dupliquées
Le formatage conditionnel permet de trouver et de mettre en évidence les doublons. Cependant, Excel ne peut pas mettre en évidence les doublons dans la zone Valeurs du rapport Tableau croisé dynamique. Pour les autres zones, suivez les étapes indiquées ci-dessous :
- Commencez par sélectionner les cellules que vous souhaitez vérifier pour les valeurs en double.
- Ensuite, vous devrez trouver l’option Valeurs dupliquées sous la mise en forme conditionnelle dans l’onglet Accueil. Onglet Accueil → Mise en forme conditionnelle → Règles de mise en évidence des cellules → Valeurs dupliquées.
- Une fois que vous avez cliqué sur l’option Valeurs dupliquées, une boîte contextuelle apparaît.
- Maintenant, dans la case à côté de l’option « valeurs avec », choisissez le formatage des valeurs dupliquées dans le menu déroulant. Cliquez ensuite sur OK.
Boîte popup des valeurs en double
Les valeurs dupliquées seront mises en évidence dans la feuille. Avant d’utiliser la fonction de suppression des doublons, n’oubliez pas qu’elle supprime définitivement toutes les données en double. Il est donc plus sage de copier les données d’origine dans une feuille de calcul séparée pour éviter toute perte accidentelle d’informations.
Suivez maintenant les étapes suivantes pour supprimer les valeurs en double :
- Sélectionnez la plage de cellules contenant des valeurs en double que vous souhaitez supprimer.
- Ensuite, localisez l’option » Supprimer les doublons » et sélectionnez-la. Onglet Données → Section Outils de données → Supprimer les doublons.
- Sous Colonnes, cochez ou décochez les colonnes dans lesquelles vous souhaitez supprimer les doublons. Cliquez ensuite sur OK.
Comment utiliser l’outil Power Query pour supprimer les doublons dans Excel ?
Power Query dans Excel vous permet d’importer des données de diverses sources, de les nettoyer et de les transformer. Cet outil permet de supprimer sans effort les doublons dans Excel.
Sélectionnez une cellule ou une plage, localisez l’onglet Données → section Obtenir et transformer des données → À partir d’une table/plage et cliquez dessus.
En cliquant, vous verrez apparaître une boîte de dialogue permettant de créer une table de requête puissante. Assurez-vous que la plage de valeurs est correctement spécifiée. Cliquez sur OK.
La fenêtre de l’éditeur Power Query apparaît.
Vous avez maintenant deux options. Vous pouvez supprimer les doublons en fonction de :
- Une ou plusieurs colonnes
- La table entière
Pour supprimer les doublons sur une ou plusieurs colonnes, cliquez avec le bouton droit de la souris sur l’en-tête de la colonne concernée. Vous pouvez sélectionner plus d’une colonne en utilisant le bouton CTRL et supprimer les doublons en conséquence.
Pour supprimer les enregistrements en double sur l’ensemble de la table, cliquez sur le bouton présent dans le coin supérieur gauche de l’aperçu des données. Puis sélectionnez l’option « Supprimer les doublons ».
De cette façon, les données seront exemptes de valeurs en double.
En cliquant sur l’option « Close & Load », les données seront chargées sur votre feuille de calcul.
Vous souhaitez faire évoluer votre carrière dans le domaine de l’analyse commerciale ? Inscrivez-vous à notre cours exclusif PGP In Business Analytics et résolvez rapidement des problèmes commerciaux complexes !