Lier ou réunir des données

Vous avez le choix entre deux méthodes pour combiner vos données dans Tableau Prep Builder : la jointure et l'union.

Lier vos données

Les données que vous analysez dans Tableau sont composées d'un ensemble de tables liées par des champs spécifiques. La jointure est une méthode permettant de combiner les données associées dans ces champs communs. Le résultat de la combinaison de données à l'aide d'une jointure est une table qui s'étend généralement à l'horizontale suite à l'ajout de champs de données.

La jointure est une opération que vous pouvez effectuer en tout point du flux. La jointure à un stade précoce du flux peut vous aider à comprendre vos ensembles de données et faire apparaître les points qui nécessitent votre attention immédiate.

Pour créer une jointure, procédez comme suit :

  1. Liez deux tables à l'aide de l'une des méthodes suivantes :

    • Ajoutez au moins deux tables au volet Flux, puis sélectionnez et faites glisser la table associée vers l'autre table jusqu'à ce que l'option Lier s'affiche ou cliquez sur l'icône et sélectionnez Ajouter une jointure dans le menu.

    • Cliquez sur l'icône et sélectionnez Ajouter une jointure dans le menu, puis ajoutez manuellement l'autre entrée à la jointure, et ajoutez les clauses de jointure.
    • Remarque : dans Tableau Prep Builder version 2019.1.3 et versions ultérieures, si vous vous connectez à une table pour laquelle des relations de tables sont définies et qui inclut des champs connexes, vous pouvez sélectionner Ajouter une jointure et faire votre choix dans la liste des tables connexes. Tableau Prep Builder crée la jointure en fonction des champs qui constituent la relation entre les deux tables.

      Pour plus d'informations sur les connecteurs avec des relations entre tables, voir Joindre des données dans l’étape Saisie.

    Une nouvelle étape de jointure est ajoutée au flux et le volet Profil se met à jour de manière à afficher le profil de jointure.

  2. Pour consulter et configurer la jointure, procédez comme suit :

    1. Consultez Résumé des résultats de la jointure pour voir le nombre de champs inclus et exclus du fait du type de jointure et des conditions de jointure.

    2. Dans Type de jointure, cliquez sur le graphique Venn pour spécifier le type de jointure souhaité.

    3. Dans Clauses de jointure appliquées, cliquez sur l'icône plus ou, dans le champ choisi pour la condition de jointure par défaut, spécifiez ou modifiez la clause de jointure. Les champs que vous avez sélectionnés dans la condition de jointure sont les champs communs aux tables de la jointure.

    4. Vous pouvez sinon cliquer sur les clauses de jointure recommandées affichées sous Recommandations relatives aux clauses de jointure pour ajouter la clause à la liste des clauses de jointure appliquées.

Examiner les résultats de la jointure

Le résumé affiché dans le profil de jointure présente les métadonnées sur la jointure pour que vous puissiez vérifier que la jointure inclut bien les données attendues.

  • Clauses de jointure appliquées : par défaut, Tableau Prep Builder définit la première clause de jointure sur la base des noms de champs communs dans les tables à lier. Ajoutez ou supprimez les clauses de jointure selon vos besoins.

  • Type de jointure : par défaut, lorsque vous créez une jointure, Tableau Prep Builder utilise une jointure interne entre les tables. Selon les données auxquelles vous vous connectez, vous pourrez peut-être utiliser les jointures gauches, internes, droites ou externes.

  • Résumé des résultats de la jointure : le résumé des résultats de la jointure présente la répartition des valeurs incluses et exclues dans les tables de la jointure.

    • Cliquez sur chaque barre Inclus pour isoler et voir les données du profil de jointure incluses dans la jointure.

    • Cliquez sur chaque barre Exclu pour isoler et voir les données du profil de jointure exclues de la jointure.

    • Cliquez sur toute combinaison de barres Inclus et Exclu pour voir une perspective cumulée des données.

  • Recommandations relatives aux clauses de jointure : cliquez sur l'icône plus à côté de la clause de jointure recommandée pour l'ajouter à la liste Clauses de jointure appliquées.

  • Volet Clauses de jointure  : dans les Clauses de jointure, vous pouvez voir les valeurs de chaque champ dans la clause de jointure. Les valeurs qui ne répondent pas aux critères de la jointure s'affichent en texte rouge.

  • Volet Résultats de la jointure : si, dans le volet Résultats de la jointure, vous voyez des valeurs que vous souhaitez modifier, vous pouvez modifier les valeurs dans ce volet.

Problèmes courants de liaison

Si vous ne voyez pas les résultats attendus après avoir lié vos données, vous devrez peut-être effectuer un nettoyage supplémentaire de vos valeurs de champ. En raison des problèmes suivants, Tableau Prep Builder ne verra pas la correspondance entre les valeurs et les exclura de la liaison :

  • Capitalisation différente : Mes Ventes et mes ventes

  • Orthographe différente : Hawaii et Hawaï

  • Faute de frappe ou faute d'orthographe : Ma santé d'entreprise ou Ma santé d'entrepise

  • Changements de nom : Pierre Martin et Pierre Martin Jr.

  • Abréviations: My Company Limited et My Company Ltd

  • Séparateurs supplémentaires : Honolulu et Honolulu (Hawaii)

  • Espaces supplémentaires : par exemple, espace supplémentaire entre des caractères, espaces de tabulation ou espaces supplémentaires de début ou de fin

  • Utilisation incohérente des points : Retourné, inutile et retourné, inutile.

La bonne nouvelle est que si vos valeurs de champ ne présentent aucun de ces problèmes, vous pouvez corriger les valeurs de champ en ligne directement dans les Clauses de jointure ou travailler avec les valeurs exclues en cliquant sur Barres exclues dans Résumé des résultats de la jointure et utiliser les opérations de nettoyage dans le menu du volet Profil.

Pour plus d'informations sur les différentes options de nettoyage disponibles, consultez Appliquer des opérations de nettoyage.

Corriger les champs discordants et autres options

Vous pouvez corriger les champs discordants directement dans la clause de jointure. Double-cliquez ou faites un clic droit sur la valeur et sélectionnez Modifier la valeur dans le menu contextuel du champ que vous souhaitez corriger et entrez une nouvelle valeur. Vos modifications de données sont enregistrées et ajoutées au volet Modifications à droite dans l'étape Lier.

Vous pouvez également sélectionner plusieurs valeurs à conserver, exclure ou filtrer dans les volets Clauses de jointure, ou appliquer d'autres opérations de nettoyage dans le volet Résultats de la jointure. Selon les champs que vous modifiez et leur emplacement dans le processus de jointure, vos modifications sont appliquées soit avant, soit après la jointure pour vous fournir les résultats corrigés.

Pour plus d'informations sur le nettoyage des champs, consultez Appliquer des opérations de nettoyage.

Réunir vos données

L'union est une méthode de combinaison des données par ajout de lignes d'une table dans une autre table. Par exemple, vous pouvez souhaitez ajouter les nouvelles transactions dans une table à la liste des transactions passées dans une autre table. Assurez-vous que les tables que vous réunissez comportent le même nombre de champs et les mêmes noms de champs, et que les champs utilisent le même type de données.

Conseil : Afin de maximiser les performances, une seule union peut avoir 10 entrées au maximum. Si vous avez besoin de réunir plus de 10 fichiers ou tables, essayez de réunir les fichiers dans l'étape des données entrantes. Pour plus d'informations sur ce type d'union, consultez Réunir des fichiers et des tables de base de données dans l'étape des données entrantes.

Comme dans une jointure, vous pouvez utiliser l'opération d'union en tout point du flux.

Pour créer une union, procédez comme suit :

  1. Après avoir ajouté au moins deux tables dans le volet Flux, sélectionnez la table concernée et faites-la glisser vers l'autre table jusqu'à ce que l'option Union s'affiche. Vous pouvez aussi cliquer sur l'icône et sélectionner Ajouter une union dans le menu. Une nouvelle étape d'union est ajoutée au volet Flux et le volet Profil se met à jour pour afficher le profil de l'union.

  2. Ajoutez des tables supplémentaires à l'union en faisant glisser des tables vers les tables de l'union jusqu'à ce que voyiez l'option Ajouter.

  3. Dans le profil de l'union, vérifiez les métadonnées relatives à l'union. Vous pouvez supprimer les tables de l'union et consulter les détails sur les champs non concordants.

Examiner les résultats de l'union

Après avoir créé une union, examinez les résultats de l'union pour vérifier que les données de l'union sont bien celles attendues. Vous pouvez vérifier plusieurs zones du profil de l'union pour valider les données de l'union.

  • Vérifier les métadonnées de l'union : Le profil d'union affiche des métadonnées sur l'union. Vous pouvez voir ici les tables qui constituent l'union, le nombre résultant de champs et les champs discordants.

  • Vérifier les couleurs pour chaque champ : À côté de chaque champ répertorié dans le résumé Union et au-dessus de chaque champ dans le profil de l'union, vous trouverez un ensemble de couleurs. Les couleurs correspondent à chaque table de l'union.

    Si toutes les couleurs de table s'affichent pour ce champ, l'union a été correctement exécutée pour ce champ. Une couleur de table manquante indique que vous avez des champs non concordants.

    Les champs discordants sont des champs qui peuvent avoir des données similaires mais qui diffèrent d'une manière ou d'une autre. Vous pouvez voir la liste des champs qui ne correspondent pas dans le résumé Union, ainsi que les tables dont ils sont issus. Pour examiner de plus près les données des champs, cochez la case Afficher uniquement les champs sans correspondance pour isoler les champs discordants dans le profil de l'union.

    Pour corriger ces champs, vous pouvez appliquer l'une des suggestions de la section « Corriger les champs non concordants » ci-dessous.

Corriger les champs non concordants

Si les tables d'une union ne correspondent pas, l'union produit des champs supplémentaires. Ces champs sont des données valides exclues de leur contexte approprié.

Pour résoudre le problème de non-concordance de champ, vous devez fusionner les champs non concordants ensemble.

La non-concordance de champ peut se produire pour plusieurs raisons.

  • Des champs correspondants ont des noms différents : Si des champs correspondants entre les tables ont des noms différents, vous pouvez utiliser les recommandations d'union, fusionner manuellement les champs de la liste Champs discordants, renommer le champ dans le profil de l'union afin de fusionner ensemble les champs non concordants.

    Pour utiliser les recommandations d'union, procédez comme suit :

    1. Dans la liste Champs discordants, cliquez sur un champ discordant. S'il existe une suggestion de correspondance, le champ correspondant est surligné en jaune.

      Les suggestions de correspondance sont basées sur les champs présentant des types de données et des noms de champ similaires.

    2. Survolez le champ surligné et cliquez sur le bouton Plus pour fusionner les champs.

    Pour fusionner manuellement des champs de la liste Champs discordants, procédez comme suit :

    1. Sélectionnez un ou plusieurs champs dans la liste.

    2. Faites un clic droit sur un champ sélectionné et si la fusion est valide, l'option de menu Fusionner les champs apparaît.

      Si vous voyez s'afficher Aucune option disponible lorsque vous faites un clic droit sur le champ, il est possible que les champs ne puissent pas être fusionnés. (par exemple, si vous essayez de fusionner deux champs issus de la même entrée).

    3. Cliquez sur Fusionner les champs pour fusionner les champs sélectionnés.

    Pour renommer le champ dans le volet du profil de l'union, faites un clic droit sur le nom du champ et cliquez sur Renommer le champ.


  • Les champs correspondants ont le même nom mais sont d'un type différent : par défaut, lorsque le nom des champs correspondants concorde mais pas leur type de données, Tableau Prep Builder modifie le type de l'un des champs afin qu'ils soient compatibles les uns avec les autres. Si Tableau Prep Builder effectue ce changement, il est indiqué en haut du champ fusionné par l'icône Modifier le type de données.

    Change Data Type Icon

    Dans certains cas, Tableau Prep Builder peut ne pas choisir le type de données correct. Dans ce cas, et si vous souhaitez annuler la fusion, faites un clic droit sur l'icône Modifier le type de données et sélectionnez Séparer les entrées avec différents types.


    Vous pouvez ensuite fusionner les champs tout d'abord en modifiant le type de données de l'un des champs, puis en utilisant les suggestions de la section Options supplémentaires de fusion des champs.

  • Les tables correspondantes ont un nombre de champs différent : pour réunir des tables, il faut que chaque table de l'union contienne le même nombre de champs. Si une union génère des champs supplémentaires, fusionnez le champ en un champ existant.

Options supplémentaires de fusion des champs

Outre les méthodes de fusion des champs décrites dans la section ci-dessus, vous pouvez également utiliser l'une des méthodes suivantes pour fusionner des champs. Vous pouvez fusionner les champs à toute étape, sauf pour l'étape Sortie.

Pour des informations sur la fusion de champs dans le même fichier, consultez Fusionner des champs.

Pour fusionner des champs, procédez comme suit :

  • Faites glisser et déposez un champ sur un autre. Un indicateur Déposer pour fusionner les champs s'affiche.

  • Sélectionnez plusieurs champs et faites un clic droit dans la sélection pour ouvrir le menu contextuel, puis cliquez sur Fusionner les champs.

  • Sélectionnez plusieurs champs, puis cliquez sur Fusionner les champs dans la barre d'outils contextuelle.

Merci pour vos commentaires ! Il y a eu une erreur lors de l’envoi de vos commentaires. Essayez à nouveau ou envoyez-nous un message.