Cette page vous a-t-elle été utile ?
Oui Non

Nettoyer et organiser les données

Vous pouvez nettoyer et organiser les données afin de faciliter la combinaison avec d'autres données ou les rendre plus compréhensibles pour votre public.

Créer votre flux

Après vous être connecté aux données que vous souhaitez inclure dans votre flux, commencez le nettoyage et l'organisation de vos données en ajoutant de nouvelles étapes au flux. Survolez une étape jusqu'à ce que l'icône plus apparaisse, puis cliquez sur l'icône pour afficher les options.

Utilisez ces options pour créer votre flux :

  • Ajouter une branche: divisez votre flux en plusieurs branches.

  • Ajouter une étape ou Insérer une étape : ajoutez une étape à une nouveau flux ou insérez une étape dans un flux existant pour effectuer des opérations de nettoyage.

  • Ajouter une agrégation : sélectionnez l'étape incluant les données à agréger ou regrouper.

  • Ajouter une permutation : sélectionnez l'étape incluant les données à permuter.

  • Ajouter une jointure : sélectionnez l'étape avec laquelle vous souhaitez lier les données. Dans Tableau Prep Builder version 2019.1.3 et versions ultérieures, si vous vous connectez à des bases de données incluant des tables contenant des données de relation, vous pouvez également créer une jointure à partir du menu du volet Flux. Pour plus d'informations sur la jointure de tables à l'aide de cette méthode, consultez Utiliser des relations entre tables existantes pour lier des données.

    Vous pouvez sinon faire glisser et déposer une étape pour lier les fichiers. Dans l'exemple suivant, nous faisons glisser l'étape des données entrantes Orders_Central et nous la déposons sur Nouvelle jointure :

    Pour plus d'informations sur la création d'une jointure, consultez Lier ou réunir des données.

  • Ajouter une union : sélectionnez l'étape avec laquelle vous souhaitez réunir les données. Vous pouvez sinon faire glisser et déposer une étape pour réunir les fichiers. Pour plus d'informations sur la création d'une réunion, consultez Lier ou réunir des données.

  • Ajouter une sortie : sélectionnez cette option pour enregistrer la sortie dans un fichier d'extrait (.tde ou .hyper) ou un fichier .csv, ou pour publier la sortie en tant que source de données sur un serveur.

Modifier le thème de couleur

Tableau Prep Builder attribue à chaque étape de votre flux une couleur par défaut. Ce thème de couleur est appliqué au flux entier pour vous aider à suivre vos données tout au long du flux à mesure que vous appliquez les étapes de nettoyage, que vous liez, réunissez ou agrégez les données. Vous savez ainsi quels fichiers sont affectés par vos opérations.

Pour sélectionner un thème de couleur différent pour vos étapes, procédez comme suit :

  1. Sélectionnez une ou plusieurs étapes.

  2. Faites un clic droit sur une étape sélectionnée et sélectionnez Modifier la couleur de l'étape.

  3. Cliquez sur une couleur dans la palette de couleurs pour l'appliquer.

Pour réinitialiser la couleur de l'étape à la couleur par défaut, procédez comme suit :

  • Cliquez sur Annuler dans le menu supérieur.

  • Ctrl+Z ou Command-Maj-Z (Mac).

  • Sélectionnez les étapes que vous avez modifiées, faites un clic droit sur l'étape sélectionnée et sélectionnez Modifier la couleur de l'étape, puis sélectionnez Réinitialiser la couleur de l'étape au bas de la palette de couleurs.

Ajouter une description

À mesure que vous créez votre flux et effectuez diverses opérations de nettoyage, vous pouvez souhaiter ajouter une description. Elle aidera les autres utilisateurs, qui examineront ou exploiteront votre flux ultérieurement, à mieux comprendre vos étapes.

Vous pouvez ajouter une description à une étape individuelle de votre flux directement dans le volet Flux. La description peut contenir jusqu'à 200 caractères.

Lorsque vous ajoutez une description, une icône de message est ajoutée sous l'étape. Cliquez sur l'icône pour afficher ou masquer le texte de la description dans le volet Flux.

Pour ajouter une description à une étape, procédez comme suit :

  1. Dans le volet Flux, sélectionnez une étape.

  2. Effectuez l'une des actions suivantes :

    • Faites un clic droit sur l'étape, et sélectionnez Ajouter une description dans le menu.

    • Double-cliquez sur le champ de nom dans l'étape, puis cliquez sur Ajouter une description.

  3. Entrez votre description dans la zone de texte.

  4. Cliquez en-dehors de la zone de texte ou appuyez sur Entrée pour appliquer vos modifications. Par défaut, la description s'affiche sous l'étape. Pour masquer la description, cliquez sur l'icône de message .

  5. Pour modifier ou supprimer la description, faites un clic droit sur l'étape ou la description, puis, dans le menu, sélectionnez Modifier la description ou Supprimer la description.

Supprimer des étapes du flux

À tout moment du flux, vous pouvez supprimer des étapes ou des lignes de flux entre les étapes.

  • Pour supprimer une étape ou une ligne de flux, sélectionnez l'étape ou la ligne à supprimer, faites un clic droit sur l'élément, puis sélectionnez Supprimer.

  • Pour supprimer plusieurs étapes ou lignes de flux, effectuez l'une des opérations suivantes :

    • Utilisez votre souris pour faire glisser et sélectionner une section entière du flux. Ensuite, faites un clic droit sur l'une des étapes sélectionnées, pus sélectionnez Supprimer

    • Appuyez sur Ctrl+A (Cmd+A sur un Mac) pour sélectionner tous les éléments du flux, ou appuyez sur Ctrl+clic (Cmd+Clic sur un Mac) pour sélectionner des éléments spécifiques, puis appuyez sur la touche Suppr.

Permuter vos données

L'analyse de données à partir d'une feuille de calcul ou d'un tableau croisé peut parfois s'avérer difficile dans Tableau. Tableau préfère que les données soient « grandes » plutôt que « larges », ce qui signifie que vous devez souvent permuter vos données de colonnes en lignes pour que Tableau puisse les évaluer correctement.

Toutefois, il peut arriver que vos tables de données soient grandes et étroites, et soient trop normalisées pour permettre une analyse correcte. Prenons par exemple un département de ventes qui assure le suivi des dépenses de publicité dans deux colonnes, l'une appelée Publicité et contenant des lignes pour la radio, la télévision et l'impression, et une colonne pour les dépenses totales. Dans ce type de scénario, pour analyser ces données en tant que mesures séparées, vous devez permuter ces données de lignes en colonnes.

Mais qu'en est-il de la permutation d'ensembles de données plus volumineux, ou de données qui changent fréquemment au fil du temps ? Vous pouvez utiliser un modèle de correspondance avec caractères génériques pour rechercher les champs correspondant au modèle et permuter automatiquement les données.

Utilisez l'une des options suivantes lorsque vous permutez vos données :

  • Permuter les colonnes en lignes

  • Utiliser la recherche avec caractères génériques pour permuter instantanément des champs selon un modèle de correspondance (Tableau Prep Builder version 2019.1.1 et ultérieure).

  • Permuter les lignes en colonnes (Tableau Prep Builder version 2019.1.1 et ultérieure).

Quelle que soit la manière dont vous permutez vos champs, vous pouvez interagir directement avec les résultats et procéder à des opérations de nettoyage supplémentaires pour que vos données se présentent comme vous le souhaitez. Vous pouvez également utiliser la fonction de dénomination intelligente par défaut de Tableau Prep Builder pour renommer automatiquement vos champs et valeurs permutés.

Remarque : la permutation de colonnes en lignes sur plusieurs groupes de champs n'est pas prise en charge dans Tableau Prep Builder 2018.1.1. La modification d'une permutation incluant des colonnes permutées sur plusieurs groupes de champs dans Tableau Prep Builder version 2018.1.1 peut générer des erreurs ou des résultats inattendus.

Permuter des colonnes en lignes :

Utilisez cette option de permutation pour passer de données larges à des données grandes. Permutez les données de colonnes en lignes sur un ou plusieurs groupes de champs. Sélectionnez les champs avec lesquels vous souhaitez travailler et permutez les données de colonnes en lignes.

  1. Connectez-vous à votre source de données.

  2. Faites glisser la table à permuter vers le volet Flux.

  3. Cliquez sur l'icône plus et sélectionnez Ajouter une permutation dans le menu contextuel.

  4. (Facultatif) Dans le volet Champs, entrez une valeur dans le champ Recherche pour rechercher les champs à permuter dans la liste de champs.

  5. (Facultatif) Sélectionnez la case à cocher Renommer automatiquement les champs et valeurs permutés pour permettre à Tableau Prep de renommer les nouveaux champs permutés en utilisant les valeurs communes dans les données. Si aucune valeur commune n'est trouvée, le nom par défaut est utilisé.
  6. Sélectionnez un ou plusieurs champs dans le volet gauche, et faites-les glisser vers la colonne Valeurs Permutation1 dans le volet Champs permutés.

  7. (Facultatif) Dans le volet Champs permutés, cliquez sur l'icône plus pour ajouter d'autres colonnes à permuter, puis répétez l'étape précédente pour sélectionner d'autres champs à permuter. Vos résultats apparaissent immédiatement à la fois dans le volet Résultats de la permutation et la grille de données.

    Remarque : vous devez sélectionner le même nombre de champs que celui sélectionné à l'étape 5. Par exemple, si vous avez sélectionné 3 champs à permuter initialement, chaque colonne suivante que vous permutez doit également contenir 3 champs.

  8. Si vous n'avez pas activé l'option de dénomination par défaut ou si Tableau Prep n'a pas pu détecter un nom automatiquement, modifiez les noms des champs. Vous pouvez également modifier les noms des champs d'origine dans ce volet pour mieux décrire les données.

  9. (Facultatif) Renommez la nouvelle étape Permutation de manière à vous souvenir de vos modifications, par exemple « Permuter les mois ».

  10. Pour actualiser vos données de permutation lorsque les données changent, exécutez votre flux. Si de nouveaux champs sont ajoutés à votre source de donnée et ont besoin d'être ajoutés à la permutation, ajoutez-les manuellement à la permutation.

Exemple : permutation sur plusieurs champs

Cet exemple présente une feuille de calcul de ventes de produits pharmaceutiques, taxes et totaux par mois et année.

En permutant les données, vous pouvez créer des lignes pour chaque mois et années, et des colonnes individuelles pour les ventes, les taxes et les totaux afin que Tableau puisse interpréter plus facilement ces données à des fins d'analyse.

Voir la « permutation de champs multiples » en action.

Utiliser la recherche avec caractères génériques pour permuter des champs

Dans Tableau Prep Builder version 2019.1.1 et ultérieure, si vous utilisez des ensemble de données volumineux ou si vos données changent fréquemment au fil du temps, vous pouvez utiliser une recherche avec caractères génériques lors de la permutation de colonnes en lignes pour permuter instantanément vos données selon un modèle de correspondance avec caractères génériques. Si de nouveaux champs correspondant au modèle sont ajoutés ou supprimés, Tableau Prep Builder détecte le changement de modèle lorsque vous exécutez le flux, et les résultats de la permutation sont automatiquement mis à jour.

  1. Connectez-vous à votre source de données.

  2. Faites glisser la table à permuter vers le volet Flux.

  3. Cliquez sur l'icône plus et sélectionnez Ajouter une permutation dans le menu contextuel.

  4. Dans le volet Champs permutés, cliquez sur le lien Cliquez ici pour créer une permutation de caractère générique.

  5. Entrez une valeur ou une valeur partielle que vous souhaitez rechercher. Par exemple, entrez Sales_ pour obtenir les champs étiquetés sous sales_2017, sales_2018 et sales_2019.

    N'utilisez pas des astérisques pour le modèle de correspondance à moins qu'ils ne fassent partie de la valeur de champ que vous recherchez. Au lieu de cela, cliquez sur le bouton Options de recherche pour sélectionner la manière dont vous souhaitez trouver la valeur. Appuyez ensuite sur Entrée pour appliquer la recherche et permuter les valeurs correspondantes.

  6. (Facultatif) Dans le volet Champs permutés, cliquez sur l'icône plus pour ajouter d'autres colonnes à permuter, puis répétez l'étape précédente pour sélectionner d'autres champs à permuter.

  7. Si vous n'avez pas activé l'option de dénomination par défaut ou si Tableau Prep Builder n'a pas pu détecter un nom automatiquement, modifiez les noms des champs.

  8. Pour actualiser vos données de permutation lorsque les données changent, exécutez votre flux. Tous les nouveaux champs ajoutés à votre source de données et correspondant au modèle avec caractères génériques sont automatiquement détectés et ajoutés à la permutation.

  9. Si les résultats ne correspondent pas à vos attentes, essayez l'une des options suivantes :

    • Entrez une valeur différente dans le champ Recherche et appuyez sur Entrée. La permutation est automatiquement actualisée et affiche les nouveaux résultats.

    • Faites glisser manuellement des champs supplémentaires vers la colonne Valeurs Permutation1 dans le volet Champs pivotés. Vous pouvez également supprimer les champs qui ont été ajoutés manuellement en les faisant glisser hors de la colonne Valeurs Permutation1 vers le volet Champs.

      Remarque : il n'est pas possible de supprimer les champs qui ont été ajoutés à partir des résultats de la recherche avec caractères génériques en les faisant glisser hors de la colonne Valeurs Permutation1. Au lieu de cela, essayez d'utiliser un modèle plus spécifique pour obtenir les résultats de recherche escomptés.

Permuter des lignes en colonnes

Dans Tableau Prep Builder version 2019.1.1, vous pouvez permuter les lignes en colonnes. Utilisez cette option si vos données sont trop normalisées et que vous avez besoin de créer de nouvelles colonnes - passer de données grandes à des données plus larges.

Par exemple, si vos coûts de publicité mensuels incluent tous les types de publicité dans une colonne, si vous permutez les données de lignes en colonnes, vous pouvez avoir une colonne séparée pour chaque type de publicité, ce qui facilite l'analyse des données.

Vous pouvez sélectionner un champ auquel appliquer la permutation. Les valeurs de champ pour ce champ sont ensuite utilisées pour créer les nouvelles colonnes. Ensuite, sélectionnez un champ à utiliser pour remplir les nouvelles colonnes. Ces valeurs de champ sont agrégées et vous pouvez sélectionner le type d'agrégation à appliquer.

En raison de l'application de l'agrégation, la permutation des colonnes à nouveau en lignes n'inverse pas cette action de permutation. Pour inverser un type de permutation de ligne en colonne, vous devez annuler l'action. Cliquez sur le bouton Annuler dans le menu supérieur, supprimez les champs du volet Champs permutés ou supprimez l'étape de permutation.

  1. Connectez-vous à votre source de données.

  2. Faites glisser la table à permuter vers le volet Flux.

  3. Cliquez sur l'icône plus et sélectionnez Ajouter une permutation dans le menu contextuel.

  4. Dans le volet Champs permutés, sélectionnez Lignes en colonnes dans la liste déroulante.

  5. (Facultatif) Dans le volet Champs, entrez une valeur dans le champ Recherche pour rechercher les champs à permuter dans la liste de champs.
  6. Sélectionnez un champ dans le volet gauche et faites-le glisser vers la section Champ qui permutera les lignes en colonnes dans le volet Champs permutés.

    Remarque : si le champ auquel vous souhaitez appliquer une permutation comporte un type de données Date ou Date/heure, vous devrez modifier le type de données en Chaîne pour le permuter.

    Les valeurs de ce champ seront utilisées pour créer et nommer les nouvelles colonnes. Vous pouvez modifier les noms des colonnes dans le volet Résultat de la permutation ultérieurement.

  7. Sélectionnez un champ dans le volet gauche et faites-le glisser vers la section Champ qui permutera les lignes en colonnes dans le volet Champs permutés. Les valeurs dans ce champ sont utilisées pour remplir les nouvelles colonnes créées à partir de l'étape précédente.

    Un type d'agrégation par défaut est affecté au champ. Cliquez sur le type d'agrégation pour le modifier.

  8. Dans le volet Résultats de la permutation, vérifiez les résultats et appliquez les opérations de nettoyage aux nouvelles colonnes que vous avez créées.

  9. Si le champ permuté est modifié dans ses données de lignes, faites un clic droit ou Command-clic (Mac) lors de l'étape de permutation dans le volet de flux et sélectionnez Actualiser.

Appliquer des opérations de nettoyage

Vous nettoyez les données en appliquant des opérations de nettoyage telles que le filtrage, l'ajout, le changement de nom, la scission, le regroupement ou la suppression de champs. Dans les versions précédentes, les opérations de nettoyage ne pouvaient être effectuées que dans le type d'étape Nettoyage. Dans Tableau Prep Builder version 2018.2.1 et versions ultérieures, vous pouviez également effectuer des opérations de nettoyage dans la grille de données lors d'une étape de nettoyage.

Dans Tableau Prep Builder version 2018.3.1 et versions ultérieures, vous pouvez effectuer des opérations de nettoyage dans la plupart des types d'étape de votre flux. La seule exception est l'étape de sortie.

La table suivante montre les opérations de nettoyage disponibles dans chaque type d'étape :

  Entrée Nettoyage Agrégation Permutation Jointure Union Sortie
Filtrer X X X X X X  
Regrouper et remplacer   X X X X X  
Nettoyer   X X X X X  
Scinder les valeurs   X X X X X  
Renommer le champ X X X X X X  
Modifier la valeur   X X X X X  
Modifier le type de données X X X X X X  
Créer un champ calculé   X X X X X  
Supprimer le champ X X X X X X  

À mesure que vous modifiez vos données, des annotations sont ajoutées à l'étape correspondante dans le volet Flux et une entrée est ajoutée dans le volet Modifications pour enregistrer vos actions. Si vous apportez des modifications dans l'étape des données entrantes, l'annotation s'affiche à gauche de l'étape dans le volet Flux et s'affiche également dans le Profil d'entrée dans la liste des champs.

L'ordre d'application de vos modifications a une incidence. Les modifications apportées dans les types d'étape Agrégation, Permutation, Jointure et Union sont effectuées soit avant, soit après ces actions de réorganisation, selon l'emplacement du champ où vous effectuez la modification. L'emplacement où la modification a été effectuée s'affiche dans le volet Modifications de l'étape.

Par exemple, si vous modifiez une valeur de champ dans une clause de jointure, la modification a lieu avant l'action de jointure pour vous fournir les résultats corrigés.

Les tableaux suivants montrent où l'action de nettoyage est effectuée dans les types d'étape Agrégation, Permutation, Jointure et Union, selon l'emplacement du champ dans l'étape.

Remarque : pour les jointures, si le champ est un champ calculé créé à l'aide d'un champ issu d'une autre table, la modification est appliquée avant la jointure. Si le champ est créé avec des champs issus des deux tables, la modification est appliquée après la jointure.

Appliquer des opérations de nettoyage à une étape des données entrantes

Seules quelques opérations de nettoyage sont disponibles dans une étape des données entrantes. Vous pouvez apporter n'importe laquelle des modifications suivantes dans la liste des champs d'entrée. Vos modifications sont enregistrées dans le volet Modifications et des annotations sont ajoutées à gauche de l'étape des données entrantes dans le volet Flux et dans la liste des champs d'entrée.

  • Filtrer : Cliquez sur Filtrer les valeurs dans la barre d'outils pour entrer vos critères de filtre dans l'éditeur de calcul.

  • Renommer un champ : Dans le champ Nom du champ, double-cliquez sur (CTRL+clic sur un Mac) sur le nom du champ et entrez un nouveau nom de champ.

  • Modifier le type de données : Cliquez sur le type de données du champ et sélectionnez un nouveau type de données dans le menu.

  • Supprimer un champ : Désélectionnez la case à cocher à côté des champs que vous ne souhaitez pas inclure dans votre flux.

Appliquer des opérations de nettoyage dans d'autres étapes

Toutes les opérations de nettoyage sont disponibles dans les autres types d'étape. Pour appliquer des opérations de nettoyage à des champs, utilisez les options de la barre d'outils ou cliquez sur Options supplémentaires dans la fiche Profil du champ pour ouvrir le menu. Dans les types d'étape Agrégation, Permutation, Jointure et Union, le menu Options supplémentaires est disponible dans les fiches Profil du volet Résultats.

Barre d'outils du volet Profil Menu déroulant

Dans une étape de nettoyage, vous pouvez également appliquer des opérations de nettoyage dans la grille de données. Cliquez simplement sur le bouton Masquer le volet Profil pour réduire le volet Profil puis cliquez sur Options supplémentaires dans un champ pour ouvrir le menu.

Remarque : les opérations de nettoyage ne sont pas toutes disponibles dans la grille de données. Par exemple, si vous souhaitez modifier une valeur en ligne, vous devez le faire dans le volet Profil.

Pour appliquer des opérations de nettoyage à un champ :

  1. Dans le volet Profil, dans la grille de données ou dans le volet Résultats, sélectionnez le champ auquel vous souhaitez apporter des modifications.

  2. Dans la barre d'outils ou le menu Options supplémentaires du champ, faites votre choix parmi les options suivantes :

    • Filtrer ou Filtrer les valeurs : vous pouvez également faire un clic droit (CTRL + clic sur un Mac) sur une valeur de champ pour conserver ou exclure des valeurs.

    • Regrouper et remplacer : sélectionnez manuellement les valeurs ou utilisez le regroupement automatique. Vous pouvez aussi sélectionner plusieurs valeurs dans la fiche Profil et faire un clic droit (CTRL+clic sur un Mac) pour regrouper ou dégrouper des valeurs ou encore modifier la valeur de regroupement.

    • Nettoyer : faites votre choix dans la liste d'opérations de nettoyage rapides à appliquer à toutes les valeurs du champ.

    • Scinder les valeurs : sélectionnez la scission automatique ou personnalisée.

      Remarque : la scission automatique et la scission personnalisée fonctionnent de la même manière que dans Tableau Desktop. Pour plus d'information, consultez Fractionner un champ en champs multiples dans l'aide de Tableau Desktop et l'aide de la création Web.

    • Renommer un champ

    • Créer un champ calculé

    • Supprimer un champ

  3. Pour modifier une valeur, faites un clic droit (CTRL+clic sur un Mac) sur une ou plusieurs valeurs, et sélectionnez Modifier la valeur puis entrez une nouvelle valeur. Vous pouvez également sélectionner Remplacer par une valeur null pour remplacer les valeurs par une valeur null ou double-cliquer sur un champ pour le modifier directement. Pour plus d'informations sur la modification des valeurs de champ, consultez Nettoyage (correction) des variations de la même valeur.

  4. Vérifiez le résultat de ces opérations dans le volet Profil, les volets Résumé ou la grille de données.

Afficher vos modifications

Les différents types d'opérations de nettoyage sont représentés par des icônes à travers les différentes étapes de votre flux. Si plus de quatre types d'opérations sont appliqués à une étape, trois points de suspension apparaissent sur l'étape. Survolez ces icônes pour voir les annotations indiquant les opérations appliquées, ainsi que leur ordre d'exécution.

Dans Tableau Prep Builder version 2019.1.3 et versions ultérieures, vous pouvez cliquer sur une annotation sur l'icône de modification dans une étape du volet Flux ou sur une fiche Profil dans le volet Profil ou Résultats. La modification et le champ affecté seront surlignés dans le volet Modifications ainsi que dans le volet Profil ou Résultats.

Vous pouvez également sélectionner une étape, puis développer le volet Modifications pour consulter les détails de chaque modification, éditer ou supprimer vos modifications, ou faire glisser des modifications vers le haut ou vers le bas pour changer leur ordre d'application. Dans Tableau Prep 2019.1.1, vous pouvez ajouter une description pour fournir un contexte à d'autres utilisateurs.

Annotation sur le nettoyage Suivi des modifications

Lorsque vous affichez les modifications pour une étape Agrégation, Permutation, Jointure ou Union, l'ordre dans lequel la modification est appliquée s'affiche avant ou après l'action de réorganisation. L'ordre de ces modifications est appliqué par le système et ne peut pas être modifié. Vous pouvez éditer et supprimer la modification.

Ajouter une description à une entrée modifiée

Dans Tableau Prep Builder version 2019.1.1, vous pouvez ajouter une description de 200 caractères maximum à toute entrée modifiée dans le volet Modifications. Pour ajouter une description, procédez comme suit :

  1. Sélectionnez une étape dans le volet de flux.

  2. Ouvrez le volet Modifications ou l'onglet Modifications.

  3. Faites un clic droit ou Ctrl-clic (Mac) sur une entrée dans le volet Modifications et sélectionnez Ajouter une description.

  4. Entrez une description pour l'étape.

    La description apparaît sous le texte généré pour la modification avec une icône de commentaire .

  5. Pour modifier ou supprimer la description, faites un clic droit (ou Ctrl+clic sur un Mac) sur l'élément à modifier, puis sélectionnez Modifier la description ou Supprimer la description.

Appliquer des opérations de nettoyage à l'aide de recommandations

Il peut parfois être difficile d'identifier l'opération de nettoyage nécessaire pour corriger les problèmes de vos données. Tableau Prep Builder version 2018.3.2 et versions ultérieures est capable d'analyser vos données et de recommander les opérations de nettoyage à appliquer automatiquement pour corriger rapidement les problèmes de vos champs de données ou identifier les problèmes afin que vous puissiez les corriger.

Remarque : si vous ne souhaitez pas utiliser cette fonctionnalité, désactivez-la. Dans le menu supérieur, accédez à Aide > Paramètres et Performances. Cliquez ensuite sur Activer les recommandations pour désélectionner la coche à côté du paramètre.

Cette fonctionnalité est disponible dans tous les types d'étape, sauf les types d'étape Entrée, Sortie et Jointure. À l'heure actuelle, les types de recommandation incluent :

  • Types de données

  • Filtrer

  • Remplacer des valeurs par des valeurs null

  • Supprimer des champs

  • Fractionner (Tableau Prep Builder version 2019.1.1 et ultérieure)

    Remarque : cette option fonctionne spécifiquement avec les données contenues dans des fichiers texte de largeur fixe. Pour utiliser la recommandation de scission avec ce type de fichier, après vous être connecté à la source de données, dans l'étape des données entrantes, dans l'onglet Paramètres du texte, sélectionnez un caractère Séparateur de champs qui n'est pas utilisé dans les données afin que les données se chargent en tant que champ unique.

  • Supprimer des espaces

Pour utiliser les recommandations de nettoyage de vos données, procédez comme suit :

  1. Effectuez l'une des actions suivantes :

    • Cliquez sur l'icône d'ampoule en haut à droite de la fiche Profil.
    • Dans la barre d'outils, cliquez sur la flèche déroulante Recommandations pour afficher toutes les recommandations concernant votre ensemble de données et sélectionnez une recommandation dans la liste.

    Cette option apparaît uniquement lorsque les modifications recommandées sont identifiées par Tableau Prep Builder.

  2. Pour appliquer la recommandation, survolez la fiche Recommandations puis cliquez sur Appliquer.

    La modification est automatiquement appliquée et une entrée est ajoutée au volet Modifications. Pour supprimer la modification, cliquez sur Annuler dans le menu supérieur ou survolez la modification dans le volet Modifications puis cliquez sur le signe X pour la supprimer.

  3. Si Tableau Prep Builder identifie d'autres recommandations suite à la modification, l'icône d'ampoule reste sur la fiche Profil jusqu'à ce qu'il n'y ait plus d'autres recommandations.

    Répétez les étapes ci-dessus pour appliquer des modifications supplémentaires ou ignorer la modification suggérée et utiliser les autres outils de nettoyage de Tableau Prep Builder pour résoudre les problèmes des données.

Fusionner des champs

Si des champs contiennent les mêmes valeurs mais ont un nom différent, vous pouvez facilement les fusionner en un seul champ pour les combiner en faisant glisser un champ sur un autre. Lorsque vous fusionnez des champs, le champ cible devient le champ principal et le nom du champ cible persiste. Le champ que vous fusionnez sur le champ cible est supprimé.

Exemple :

une union de caractères génériques a pour résultat 3 champs contenant les mêmes valeurs. Fusionner 3 champs en 1

Lorsque vous fusionnez des champs, Tableau Prep Builder conserve tous les champs du champ cible et remplace toutes les valeurs null de ce champ par les valeurs issues des champs source que vous fusionnez avec le champ cible. Les champs source sont supprimés.

Exemple

Nom Téléphone_Contact Téléphone_Professionnel Téléphone_Mobile Téléphone_Domicile
Bob 123-4567 123-4567 null null
Sally null null 456-7890 789-0123
Fred null null null 567-8901
Emma null 234-5678 345-6789 null

Si vous fusionnez Téléphone_Professionnel, Téléphone_Mobile et Téléphone_Domicile avec le champ Téléphone_Contact, les autres champs sont supprimés et le résultat se présente ainsi :

Nom Téléphone_Contact
Bob 123-4567
Sally 456-7890
Fred 567-8901
Emma 234-5678

Pour fusionner des champs, procédez comme suit :

  • Faites glisser et déposez un champ sur un autre. Un indicateur Déposer pour fusionner les champs s'affiche.

  • Sélectionnez plusieurs champs et faites un clic droit dans la sélection pour ouvrir le menu contextuel, puis cliquez sur Fusionner les champs.

  • Sélectionnez plusieurs champs, puis cliquez sur Fusionner les champs dans la barre d'outils.

Pour savoir comment corriger des champs discordants suite à une union, consultez Corriger les champs non concordants.

Nettoyage (correction) des variations de la même valeur

Plusieurs variations de la même valeur peuvent vous empêcher de résumer correctement vos données. Vous pouvez corriger ces variations rapidement et aisément en appliquant les options suivantes dans Tableau Prep Builder.

Remarque : toutes les modifications que vous apportez aux valeurs doivent être compatibles avec le type de champ de données.

Modifier une seule valeur

  1. Dans la fiche Profil, cliquez sur la valeur à modifier puis entrez la nouvelle valeur. Une icône de groupe s'affiche à côté de la valeur.

    Sinon, faites un clic droit sur une valeur et cliquez sur Modifier la valeur. La modification est enregistrée dans Suivi des modifications sur le côté gauche de l'écran.

  2. Affichez les résultats dans le volet Profil et la grille de données.

Modifier plusieurs valeurs

Vous avez plusieurs possibilités pour modifier plusieurs valeurs à la fois. Par exemple, utilisez des opérations de nettoyage rapide pour supprimer la ponctuation de toutes les valeurs du champ, regrouper manuellement des valeurs en utilisant la sélection multiple ou regrouper automatiquement ensemble des valeurs à l'aide d'algorithmes de correspondance approximative qui trouvent les valeurs similaires, ou encore sélectionner plusieurs valeurs et les remplacer par des valeurs null.

Remarque : lorsque vous associez plusieurs valeurs à une seule valeur, le champ d'origine montre une icône de groupe à côté de la valeur. Elle vous indique quelles valeurs sont regroupées ensemble.

Modifier plusieurs valeurs en utilisant les opérations de nettoyage rapides

Cette option s'applique uniquement aux champs textuels.

  1. Dans le volet Profil, le volet Résultats ou la grille de données, sélectionnez le champ à modifier.

  2. Cliquez sur Options supplémentaires, sélectionnez Nettoyer, puis sélectionnez l'une des options suivantes:

    • Mettre en majuscule : modifiez toutes les valeurs en texte en majuscule.

    • Mettre en minuscule : modifiez toutes les valeurs en texte en minuscule.

    • Supprimer les lettres : supprimez toutes les lettres et laissez uniquement les autres caractères.

    • Supprimer les nombres : supprimez tous les nombres et laissez les lettres et les autres caractères.

    • Supprimer la ponctuation : supprimez toutes la ponctuation.

    • Supprimer les espaces : supprimez les espaces de début et de fin.

    Vous pouvez empiler les opérations pour appliquer plusieurs opérations de nettoyage aux champs. Par exemple, commencez par sélectionner Supprimer > Supprimer les nombres puis sélectionnez Nettoyer > Supprimer la ponctuation pour supprimer tous les nombres et la ponctuation des valeurs de champ.

  3. Pour annuler vos modifications, cliquez sur la flèche Annuler en haut du volet Flux ou supprimez la modification de la liste des modifications.

Regrouper et modifier plusieurs valeurs en ligne

  1. Dans la fiche Profil, sélectionnez le champ à modifier.

  2. Appuyez sur Ctrl ou Maj+clic, ou Command ou Maj+clic (sur Mac), et sélectionnez les valeurs que vous souhaitez regrouper.

  3. Faites un clic droit et sélectionnez Groupe dans le menu contextuel. La valeur de la sélection sur laquelle vous faites un clic droit devient le nom par défaut du nouveau groupe, mais vous pouvez le modifier en ligne.

  4. Pour modifier le nom du groupe, sélectionnez le champ groupé et modifiez la valeur ou faites un clic droit (ou Ctrl+clic sur un Mac) sur le champ groupé et sélectionnez Modifier la valeur dans le menu contextuel.

  5. Pour dégrouper les valeurs d'un champ groupé, faites un clic droit sur le champ groupé, puis sélectionnez Dégrouper dans le menu contextuel.

Remplacer une ou plusieurs valeurs par une valeur null

Si vous souhaitez inclure des lignes de données dans votre analyse, mais exclure certaines valeurs de champ, vous pouvez les transformer en une valeur null.

  1. Dans la fiche Profil, appuyez sur Ctrl ou Maj+clic, ou Command ou Maj+clic (sur Mac), et sélectionnez les valeurs que vous souhaitez modifier

  2. Faites un clic droit ou Ctrl+clic (Mac), et sélectionnez Remplacer par une valeur null dans le menu. Les valeurs sont transformées en valeurs null et l'icône de groupe apparaît à côté de la valeur.

Modifier plusieurs valeurs manuellement à l'aide de Regrouper et remplacer

Utilisez l'option Regrouper et remplacer pour associer la valeur d'un champ à une autre valeur ou sélectionner manuellement plusieurs valeurs pour les regrouper. Vous pouvez même ajouter de nouvelles valeurs pour configurer des relations de mappage afin d'organiser vos données.

Par exemple, imaginons qu'un champ comporte trois valeurs : Ma société, Ma société Incorporated et Ma société Inc. Ces valeurs représentent toutes trois la même entreprise, Ma société. Vous pouvez utiliser Regrouper et remplacer pour associer les valeurs Ma société Incorporated et Ma société Inc. à Ma société afin que les valeurs s'affichent toutes trois comme Ma société dans le champ.

Associer plusieurs valeurs à un champ sélectionné unique

  1. Dans le volet Profil ou le volet Résultats, sélectionnez le champ à modifier.

  2. Cliquez sur Options supplémentaires et sélectionnez Regrouper et remplacer > Sélection manuelle dans le menu.

  3. Dans le volet gauche de l'éditeur Regrouper et remplacer, sélectionnez la valeur de champ que vous souhaitez utiliser comme valeur de regroupement. Cette valeur s'affiche maintenant en haut du volet droit.

  4. Dans la section inférieure du volet droit dans l'éditeur Regrouper et remplacer, sélectionnez les valeurs à ajouter au groupe.

    Pour supprimer des valeurs du groupe, dans la section supérieure du volet droit, dans l'éditeur Regrouper et remplacer, désactivez la case à cocher à côté des valeurs.

Créer un groupe en sélectionnant plusieurs valeurs

  1. Dans le volet Profil ou le volet Résultats, sélectionnez le champ à modifier.

  2. Cliquez sur Options supplémentaires et sélectionnez Regrouper et remplacer > Sélection manuelle dans le menu.

  3. Dans le volet gauche de l'éditeur Regrouper et remplacer, sélectionnez plusieurs valeurs que vous souhaitez regrouper.

  4. Dans le volet droit de l'éditeur Regrouper et remplacer, cliquez sur Regrouper les valeurs.

    Un nouveau groupe est créé à l'aide de la dernière valeur sélectionnée comme nom de groupe. Pour modifier le nom du groupe, sélectionnez le champ groupé et modifiez la valeur ou faites un clic droit (ou Ctrl+clic sur un Mac) sur le champ groupé et sélectionnez Modifier la valeur dans le menu.

Modifier plusieurs valeurs à l'aide de Regrouper et remplacer avec une correspondance approximative

Pour rechercher et regrouper automatiquement des valeurs similaires, utilisez l'un des algorithmes de correspondance approximative. Les valeurs de champ sont regroupées sous la valeur qui apparaît le plus fréquemment. Consultez les valeurs regroupées, et ajoutez ou supprimez des valeurs dans le groupe comme nécessaire.

Choisissez l'une des options suivantes pour regrouper les valeurs :

  • Prononciation : trouvez et regroupez les valeurs ayant la même sonorité. Cette option utilise l'algorithme Metaphone 3 qui indexe les mots selon leur prononciation et est plus spécifiquement adapté aux mots anglais. Ce type d'algorithme est utilisé par de nombreux correcteurs orthographiques.

  • Caractères communs : trouvez et regroupez les valeurs ayant des lettres et des nombres en commun. Cette option utilise l'algorithme d'empreinte digitale ngram qui indexe les mots par leurs caractères uniques après avoir supprimé la ponctuation, les doublons et les espaces blancs. Cet algorithme fonctionne quelle que soit la langue prise en charge.

    Par exemple, cet algorithme associerait les noms représentés sous la forme « John Smith » et « Smith, John » parce qu'ils génèrent tous deux la clé « hijmnost ». Cet algorithme ne prenant pas en considération la prononciation, la valeur « Tom Jhinois » aurait la même clé « hijmnost » et serait également inclus dans le groupe.

  • Orthographe : trouvez et regroupez les valeurs ayant la même orthographe. Cette option utilise l'algorithme de distance Levenshtein qui calcule une distance de modification entre deux valeurs de texte utilisant un seuil fixe par défaut. Elle les regroupe ensuite lorsque la distance de modification est inférieure à la valeur de seuil. Cet algorithme fonctionne quelle que soit la langue prise en charge.

Pour regrouper et remplacer automatiquement les valeurs en utilisant la correspondance approximative, procédez comme suit :

  1. Dans le volet Profil ou le volet Résultats, sélectionnez le champ à modifier.

  2. Cliquez sur Options supplémentaires et sélectionnez Regrouper et remplacer puis sélectionnez l'une de ces options :

    • Prononciation

    • Caractères communs

    • Orthographe

    Tableau Prep Builder trouve et regroupe les valeurs qui correspondent et les remplace par la valeur qui se présente le plus fréquemment dans le groupe.

  3. Consultez les regroupements, et ajoutez ou supprimez manuellement des valeurs, ou modifiez-le comme nécessaire. Cliquez ensuite sur Terminer.

Ajouter et identifier des valeurs qui ne sont pas présentes dans l'ensemble de données

Si vous souhaitez associer des valeurs de votre ensemble de données à une nouvelle valeur qui n'existe pas, vous pouvez les ajouter à l'aide de Regrouper et remplacer. Pour que vous puissiez identifier rapidement les valeurs qui ne sont pas dans l'ensemble de données, ces valeurs sont marquées avec un point rouge à côté du nom de la valeur dans l'éditeur Regrouper et remplacer.

Par exemple, dans l'image ci-dessous, le Wyoming et le Nevada ne figurent pas dans l'ensemble de données.

Voici quelques raisons pour lesquelles une valeur peut ne pas être dans l'ensemble de données :

  • Vous venez d'ajouter la nouvelle valeur manuellement.

  • La valeur n'est plus dans les données.

  • La valeur est dans les données mais n'est pas dans l'ensemble de données échantillonné.

Pour ajouter une nouvelle valeur :

  1. Dans le volet Profil ou le volet Résultats, sélectionnez le champ à modifier.

  2. Cliquez sur Options supplémentaires et sélectionnez Regrouper et remplacer > Sélection manuelle dans le menu contextuel.

  3. Dans le volet gauche de l'éditeur Regrouper et remplacer, cliquez sur l'icône plus pour ajouter une nouvelle valeur.

  4. Entrez une nouvelle valeur dans le champ et appuyez sur Entrée pour l'ajouter.

  5. Dans le volet droit, sélectionnez les valeurs à associer à la nouvelle valeur.

  6. (Facultatif) Pour ajouter de nouvelles valeurs supplémentaires à votre valeur mappée, cliquez sur le bouton plus dans le volet droit de l'éditeur Regrouper et remplacer.

Agréger et regrouper les données

Parfois vous devez ajuster la granularité de certaines données, soit pour réduire la quantité de données produites à partir du flux, soit pour aligner des données avec d'autres données que vous souhaitez lier ou réunir. Par exemple, vous pouvez souhaiter agréger des données de ventes par client avant de lier une table de ventes avec une table de clients.

Si vous avez besoin d'ajuster la granularité de vos données, utilisez l'option Ajouter une agrégation pour créer une étape d'agrégation ou de regroupement des données. Le fait que les données soient agrégées ou regroupées dépend du type de données (chaîne, nombre ou date).

  1. Dans le volet Flux, cliquez sur l'icône plus et sélectionnez Ajouter une agrégation. Une nouvelle étape d'agrégation s'affiche dans le volet Flux et le volet Profil est mis à jour pour afficher le profil d'agrégation et de groupe.

  2. Pour regrouper ou agréger des champs, faites-les glisser depuis le volet gauche vers l'une des colonnes dans le volet droit.

    Vous pouvez aussi :

    • Faire glisser et déposer des champs entre les deux volets.

    • Rechercher des champs dans la liste et sélectionner uniquement les champs que vous souhaitez inclure dans l'agrégation.

    • Double-cliquer sur un champ pour l'inclure dans le volet gauche ou droit.

    • Modifier la fonction du champ pour l'ajouter automatiquement au volet approprié.

    • Cliquer sur Ajouter tout ou Tout supprimer pour appliquer ou supprimer des champs en lots.

    • Appliquer des opérations de nettoyage à des champs.

    Les champs sont distribués entre les colonnes Champs regroupés et Champs agrégés en fonction de leur type de données. Cliquez sur les en-têtes de type de groupe ou d'agrégation (par exemple, AVG ou SUM) pour modifier le type de groupe ou d'agrégation.

    Dans les grilles de données sous le profil d'agrégation et de groupe, vous pouvez voir un échantillon des membres du groupe ou de l'agrégation.

    Toutes les opérations de nettoyage exécutées sur les champs sont enregistrées dans le volet Modifications.