Cette page vous a-t-elle été utile ?
Oui Non

Lier vos données

Les données que vous analysez dans Tableau sont composées d'un ensemble de tables liées par des champs spécifiques (à savoir des colonnes). La liaison est une méthode permettant de combiner les données liées à ces champs communs. Le résultat de la combinaison de données à l'aide d'une liaison est une table virtuelle qui s'étend généralement à l'horizontale suite à l'ajout de colonnes de données.

Remarque : lorsque vous liez des tables, les champs que vous liez doivent avoir le même type de données. Si vous modifiez le type de données après avoir lié les tables, la liaison sera interrompue.

Par exemple, supposons que vous analysiez les données pour un publicateur. Le publicateur peut avoir deux tables. La première table contient les numéros d'ID, le prénom, le nom et le type de publicateur. La seconde table contient les numéros d'ID, les prix, les droits d'auteur et les titres des livres publiés. Le champ connexe entre les deux tables pourrait être ID.

Table 1

ID Prénom Nom Type de publicateur
20034 Adam Davis Indépendant
20165 Ashley Garcia Grande maison d'édition
20233 Susan Nguyen Petite/moyenne maison d'édition

Table 2

Titre du livre Prix Droits d'auteur ID
Weather in the Alps 19.99 5 000 20165
My Physics 8.99 3 500 20800
The Magic Shoe Lace 15.99 7 000 20034

Pour analyser ces deux tables ensemble, vous pouvez lier les tables sur la base du champ ID pour répondre à des questions telles que « Quel était le montant des droits d'auteur pour un publicateur donné ? ». Combiner des tables à l'aide d'une liaison vous permet d'afficher et d'utiliser les données connexes de différentes tables dans votre analyse.

ID Prénom Nom Type de publicateur Titre du livre Prix Droits d'auteur
20034 Adam Davis Indépendant The Magic Shoe Lace 15.99 7 000
20165 Ashley Garcia Grande maison d'édition Weather in the Alps 19.99 5 000

Présentation des types de liaison

En général, vous avez le choix entre quatre types de liaison possibles pour combiner vos données dans Tableau : interne, gauche, droite et externe entière. Les tables que vous pouvez lier et les différents types de liaison utilisables dépendent de la base de données ou du fichier auquel vous vous connectez. Vous pouvez déterminer les types de liaison pris en charge par vos données en vous reportant à la boîte de dialogue de liaison après vous être connecté à vos données et être en possession d'au moins deux tables sur le canevas.

Type de liaison Résultat Description
Interne

Lorsque vous utilisez une liaison interne pour combiner des tables, le résultat est une table qui contient des valeurs ayant des correspondances dans les deux tables.

 

Gauche

Lorsque vous utilisez une liaison gauche pour combiner des tables, le résultat est une table qui contient toutes les valeurs de la table gauche et les correspondances issues de la table droite.

Lorsqu'une valeur de la table gauche n'a pas de correspondance dans la table droite, vous voyez une valeur null dans la grille de données.

Droite

Lorsque vous utilisez une liaison droite pour combiner des tables, le résultat est une table qui contient toutes les valeurs de la table droite et les correspondances issues de la table gauche.

Lorsqu'une valeur de la table droite n'a pas de correspondance dans la table gauche, vous voyez une valeur null dans la grille de données.

Externe entière

Lorsque vous utilisez une liaison externe entière pour combiner des tables, le résultat est une table qui contient toutes les valeurs des deux tables.

Lorsqu'une valeur de l'une des tables n'a pas de correspondance dans l'autre table, vous voyez une valeur null dans la grille de données.

Union Bien qu'elle ne soit pas un type de liaison, l'union constitue une autre méthode de combinaison de deux tables ou plus en ajoutant des lignes de données depuis une table vers une autre. Idéalement, les tables que vous unifiez doivent comporter le même nombre de champs, et ces champs doivent avoir des noms et des types de données correspondants. Pour plus d'informations sur l'union, consultez Réunir vos données.

Combiner des tables provenant de la même base de données

Si les tables que vous devez analyser proviennent d'une base de données, d'un classeur (Excel) ou d'un répertoire (pour le texte) identique, utilisez la procédure suivante pour combiner les tables. La combinaison de tables provenant de la même base de données requiert une seule connexion à la source de données. En règle générale, lier des tables provenant de la même base de données offre de meilleures performances. En effet, l'interrogation des données stockées dans la même base de données demande moins de temps et utilise les capacités natives de la base de données pour effectuer la liaison.

Remarque : Selon le niveau de détail des tables que vous souhaitez combiner, vous pouvez plutôt envisager la fusion des données. Pour plus d'informations, consultez Fusionner vos données.

Pour lier des tables

  1. Dans Tableau Desktop : Sur la page de démarrage, sous Connexion, cliquez sur un connecteur pour vous connecter à vos données. Cette étape permet d'établir automatiquement la première connexion à la source de données Tableau.

    Dans la création Web : Sélectionnez Nouveau classeur et connectez-vous à vos données. Cette étape permet d'établir automatiquement la première connexion à la source de données Tableau.

  2. Sélectionnez le fichier, la base de données ou le schéma, puis double-cliquez sur une table ou faites-la glisser vers le canevas.

    Remarque : si vous créez sur le Web ou que vous êtes connecté à Tableau Server (depuis Tableau Desktop) lorsque vous configurez la source de données, vous avez accès aux tables recommandées pour faciliter la combinaison de vos données. Pour plus d'informations, consultez Utiliser des sources de données et des tables certifiées et recommandées.

  3. Double-cliquez sur une table ou faites-la glisser vers l'espace de travail, puis cliquez sur la relation de jointure pour ajouter des clauses de jointure et sélectionner le type de jointure.

  4. Ajoutez une ou plusieurs conditions de jointure en sélectionnant un champ dans l'une des tables disponibles utilisées dans la source de données, un opérateur de jointure et un champ dans la table ajoutée. Inspectez la clause de jointure afin de vous assurer qu'elle reflète la façon dont vous souhaitez connecter les tables.

    Par exemple, dans une source de données comprenant une table pour les informations relatives aux commandes et une autre pour les informations relatives aux retours, vous pouvez utiliser une liaison interne pour combiner les deux tables grâce au champ Order ID qui existe dans ces deux tables.

    Remarque : vous pouvez supprimer des clauses de jointure indésirables en cliquant sur l'icône « x » qui s'affiche lorsque vous survolez le côté droit de la clause.

  5. Une fois que vous avez fini, fermez la boîte de dialogue de jointure.

Après avoir créé une liaison, vérifiez la grille de données pour vous assurer que la liaison produit les résultats escomptés. Pour plus d'informations, consultez Analyser les résultats de la liaison dans la grille de données. Pour résoudre votre problème de jointure, consultez Résolution des problèmes de liaison.

Continuez à préparer votre source de données pour une analyse. Vous pouvez renommer et réinitialiser des champs, créer des calculs, nettoyer vos données avec l'interpréteur de données, modifier les types de données des champs de texte et Excel, etc.

À propos des valeurs null dans les clés de liaison

En général, les liaisons sont effectuées au niveau de la base de données. Si les champs utilisés pour lier des tables contiennent des valeurs null, la plupart des bases de données renvoient des données sans les lignes contenant les valeurs null. Toutefois, si vous avez configuré votre source de données à connexion unique de manière à utiliser une connexion Excel, texte ou Salesforce, Tableau fournit une option supplémentaire permettant de lier des champs contenant des valeurs null à d'autres champs contenant également des valeurs null.

Pour lier des valeurs null

  • Après avoir configuré votre source de données, sélectionnez Données > Lier des valeurs Null à des valeurs Null dans la page Source de données.

Par exemple, supposons que vous avez deux tables de données que vous souhaitez lier : Orders_June et Orders_July.

Orders_June Orders_July
ID Location
1 New York
2  
3 Miami
ID Location
1 New York
2  
3 Miami

Si vous liez la fois les champs ID et Location, la plupart des bases de données renvoient la table de données suivante :

Join (of Orders_June and Orders_July)

ID Location ID(Orders_July) Location (Orders_July)
1 New York 1 New York
3 Miami 3 Miami

Si vous utilisez une seule connexion Excel, texte ou Salesforce à votre source de données, sélectionnez Données > Lier les valeurs null aux valeurs null pour revenir à la table suivante :

Join (of Orders_June and Orders_July)

ID Location ID(Orders_July) Location (Orders_July)
1 New York 1 New York
2 null 2 null
3 Miami 3 Miami

Remarque : cette option est disponible pour les sources de données à connexion unique utilisant des connexions texte, Excel et Salesforce. Si vous ajoutez une seconde connexion à une source de données qui utilise cette option, la liaison revient au comportement par défaut qui consiste à exclure les lignes comportant des valeurs null.

Combiner des tables provenant de bases de données différentes

Depuis Tableau version 10.0, si les tables que vous devez analyser sont stockées dans des bases de données, classeurs (Excel) ou répertoires (pour le texte) différents, utilisez la procédure suivante pour combiner les tables à l'aide d'une liaison entre les bases de données.

Les liaisons entre les bases de données nécessitent de configurer d'abord une source de données multiconnexion, c'est-à-dire de créer une nouvelle connexion à chaque base de données avant de lier des tables. Lorsque vous vous connectez à plusieurs bases de données, une source de données devient une source de données multiconnexion. Les sources de données multi-connexions peuvent être avantageuses si vous avez besoin d'analyser des données pour une organisation utilisant des systèmes internes différents ou de travailler avec des données gérées séparément par les groupes internes et externes.

Remarque : dans de nombreux cas, l'utilisation d'une liaison entre les bases de données constitue la méthode principale de combinaison de vos données. Toutefois, dans certains cas, vous pouvez avoir besoin de combiner vos données en utilisant plutôt la fusion des données. Pour plus d'informations, consultez Fusionner vos données.

Une fois que vous avez combiné les tables à l'aide d'une liaison entre les bases de données, Tableau colorise les tables du canevas et les colonnes de la grille de données pour montrer de quelle connexion les données proviennent.

Pour lier des tables provenant de bases de données différentes

  1. Dans Tableau Desktop : Sur la page de démarrage, sous Connexion, cliquez sur un connecteur pour vous connecter à vos données. Cette étape permet d'établir automatiquement la première connexion à la source de données Tableau.

    Dans la création Web : Sélectionnez Nouveau classeur et connectez-vous à vos données. Cette étape permet d'établir automatiquement la première connexion à la source de données Tableau.

  2. Sélectionnez le fichier, la base de données ou le schéma, puis double-cliquez sur une table ou faites-la glisser vers le canevas.

  3. Dans le volet de gauche, sous Connexions, cliquez sur le bouton Ajouter (+ dans la création Web) pour ajouter une nouvelle connexion à la source de données Tableau. Une nouvelle connexion est nécessaire si des données connexes sont stockées dans une autre base de données.

    Remarque : si le connecteur souhaité n'est pas disponible dans la liste Connexion, cela signifie que les liaisons entre les bases de données ne sont pas prises en charge pour la combinaison de sources que vous voulez lier. Cela concerne les connexions aux données de type cube (par exemple Microsoft Analysis Services), de type extrait seulement (par exemple Google Analytics et OData), ainsi que les sources de données Tableau Server. Au lieu de lier les tables, pensez à fusionner les données. Pour plus d'informations, consultez Fusionner vos données.

  4. Ajoutez une ou plusieurs conditions de jointure en sélectionnant un champ dans l'une des tables disponibles utilisées dans la source de données, un opérateur de jointure et un champ dans la table ajoutée. Inspectez la clause de jointure afin de vous assurer qu'elle reflète la façon dont vous souhaitez connecter les tables.

    Par exemple, dans une source de données comprenant une table pour les informations relatives aux commandes et une autre pour les informations relatives aux retours, vous pouvez lier les deux tables grâce au champ Order ID qui existe dans ces deux tables. Sélectionnez le type de liaison.

    Remarque : vous pouvez supprimer une clause de jointure indésirable en cliquant sur l'icône « x » qui s'affiche lorsque vous survolez le côté droit de la clause.

  5. Une fois que vous avez fini, fermez la boîte de dialogue de liaison.

    Les tables et les colonnes sont colorisées pour vous montrer la provenance des données.

Une fois la liaison créée entre les bases de données, continuez à préparer votre source de données multiconnexion en vue de les analyser. Vous pouvez renommer et réinitialiser des champs, créer des calculs, nettoyer vos données avec l'interpréteur de données, modifier les types de données des champs de texte et Excel, etc.

Pour résoudre votre problème de jointure, consultez Résolution des problèmes de liaison.

Utilisation de sources de données multi-connexions

Utiliser des données multiconnexion est similaire à l'utilisation de toute autre source de données, à quelques précautions près, que nous allons discuter dans cette section.

Réunir des données depuis une connexion

Pour unir des données, vous devez utiliser des tables de texte ou des tables Excel provenant de la même connexion. Cela signifie que vous ne pouvez pas réunir des tables provenant de différentes bases de données. Dans Tableau Desktop, vous pouvez réunir des tables à travers différents fichiers et classeurs Excel dans différents dossiers. Pour plus d'informations, voir Réunir des tables en utilisant la recherche avec caractères génériques (Tableau Desktop).

Si vous souhaitez réunir les données de plusieurs bases de données, utilisez Tableau Prep.

Interclassement

L'interclassement désigne les règles d'une base de données déterminant la manière dont les valeurs de chaîne doivent être comparées et triées. Dans la plupart des cas, l'interclassement est géré par la base de données. Toutefois, lorsque vous utilisez des liaisons entre des bases de données, il peut vous arriver de lier des colonnes ayant des interclassements différents.

Par exemple, supposons que votre liaison entre des bases de données ait utilisé une clé de liaison comportant une colonne sensible à la casse provenant de SQL Server et une colonne non sensible à la casse provenant d'Oracle. Dans ce type de cas, Tableau mappe certains interclassements avec d'autres afin de minimiser l'interprétation incorrecte des valeurs.

Les règles suivantes sont utilisées dans les liaisons entre des bases de données :

  • Si une colonne utilise les normes d'interclassement de l'ICU (International Components for Unicode), Tableau utilise l'interclassement de l'autre colonne.

  • Si toutes les colonnes utilisent les normes d'interclassement de l'ICU, Tableau utilise l'interclassement de la colonne de la table de gauche.

  • Si aucune colonne n'utilise les normes d'interclassement de l'ICU, Tableau utilise un interclassement binaire. Un interclassement binaire signifie que les paramètres régionaux de la base de données et le type de données des colonnes déterminent la manière dont les valeurs de chaîne doivent être comparées et triées.

Lorsque vous utilisez des données Microsoft Excel, si vous devez conserver la police de caractères pour vos données lors de jointures, par exemple pour des données japonaises utilisant le jeu de caractères Kana, vous pouvez activer l'option Conserver la police de caractères (Excel) dans le menu Données.

Lorsque cette option est sélectionnée, Tableau conserve la police de caractères des valeurs de votre source de données Excel et identifie de manière unique les valeurs avec différentes polices de caractères au lieu de les combiner, ce qui génère un nombre différent de lignes.

Prenons par exemple une feuille de calcul avec la valeur « Maison » et une autre feuille de calcul avec les valeurs « Maison », « maison » et « maiSon ». Par défaut, lorsque vous liez les deux tables, Tableau ignore les différences de police de caractères dans la deuxième feuille de calcul et lie « Maison », « maison » et « maiSon » dans la deuxième feuille de calcul avec « Maison » dans la première feuille de calcul.

Lorsque l'option Conserver la police de caractères (Excel) est activée, lorsque vous liez vos tables, Tableau reconnaît les différences de police de caractères. Les résultats de la jointure affichent moins de résultats, car la jointure associe uniquement « Maison » dans la première feuille de calcul avec la valeur « Maison » dans la deuxième feuille de calcul, et lit « maison » et « maiSon » comme des valeurs uniques distinctes.

Remarque : cette option est disponible pour toutes les langues prises en charge par Tableau et ne dépend pas des paramètres régionaux de votre système d'exploitation. Cette option est uniquement disponible pour les sources de données Microsoft Excel.

Calculs et sources de données multi-connexions

Vous ne pouvez appliquer qu'un sous-ensemble de calculs à une source de données multiconnexion.

Dans Tableau Desktop : Vous pouvez utiliser un calcul spécifique si ces deux conditions sont réunies :

  • Pris en charge par toutes les connexions dans la source de données multi-connexions

  • Pris en charge par les extraits Tableau.

Dans la création Web (Tableau Online et Tableau Server) : vous pouvez utiliser un calcul spécifique s'il est pris en charge par toutes les connexions dans la source de données multiconnexion.

Procédures stockées

Les procédures stockées ne sont pas disponibles pour les sources de données multi-connexions.

Faire pivoter les données depuis une connexion

Pour faire pivoter des données, vous devez utiliser des colonnes de texte ou des colonnes Excel provenant de la même connexion. Cela signifie que vous ne pouvez pas inclure des colonnes provenant de différentes bases de données dans un tableau croisé.

Mettre en premier la connexion aux fichiers d'extrait (Tableau Desktop uniquement)

Lorsque vous vous connectez à des fichiers d'extrait dans une source de données multiconnexion, assurez-vous que la connexion au fichier d'extrait (.tde ou .hyper) vient en premier. De cette manière, toutes les personnalisations faisant partie de l'extrait sont préservées, y compris les modifications apportées aux propriétés par défaut, aux champs calculés, aux groupes, aux alias, etc.

Remarque : si vous avez besoin de vous connecter à plusieurs fichiers d'extrait dans une source de données multi-connexions, seules les personnalisations de l'extrait dans la première connexion sont préservées.

Extraits de sources de données multiconnexion contenant des connexions vers des données basées sur des fichiers (Tableau Desktop uniquement)

Si vous publiez un extrait d'une source de données multiconnexion contenant une connexion aux données basées sur un fichier tel qu'un fichier Excel, sélectionner l'option Inclure des fichiers externes place une copie des données basées sur un fichier sur le serveur comme partie intégrante de la source de données. Dans ce cas, une copie de vos données basées sur un fichier peut être téléchargée, et son contenu accédé par d'autres utilisateurs. Si les données basées sur un fichier contiennent des informations confidentielles, ne sélectionnez pas l'option Inclure les fichiers externes lorsque vous publiez la source de données.

Pour plus d'informations sur la publication de sources de données, consultez Publier une source de données.

Requêtes et liaisons entre des bases de données

Pour chaque connexion, Tableau envoie des requêtes indépendantes aux bases de données de la liaison. Les résultats sont stockés dans une table temporaire au format d'un fichier d'extrait.

Par exemple, supposons que vous créez des connexions à deux tables, dbo.listings et reviews$. Ces tables sont stockées dans deux bases de données différentes, SQL Server et Excel. Tableau interroge la base de données dans chaque connexion indépendamment. La base de données exécute la requête et applique des personnalisations telles que des filtres et des calculs, et Tableau stocke les résultats de chaque connexion dans une table temporaire. Dans cet exemple, FQ_Temp_1 est la table temporaire pour la connexion à SQL Server et FQ_Temp_2 est la table temporaire pour la connexion à Excel.

Table SQL Server

Table Excel

Lorsque vous effectuez une liaison entre des bases de données, les tables temporaires sont liées ensemble par Tableau Desktop. Ces tables temporaires sont nécessaires pour que Tableau effectue des liaisons entre les bases de données.

Une fois que toutes les tables ont été liées, « topn" est appliqué afin de limiter le nombre de valeurs affichées dans la grille de données aux 1000 premières lignes. Ce filtre est appliqué pour conserver la réactivité de la grille de données et les performances générales de la page Source de données.

Tables liées

Analyser les résultats de la liaison dans la grille de données

Après avoir créé une liaison dans le canevas, vérifiez la grille de données pour vous assurer que la liaison produit les résultats escomptés. Si la grille de données affiche des données inattendues, vous devrez peut-être modifier la liaison.

Résultats dans la grille de données

  • Aucune donnée : Si aucune donnée ne s'affiche dans la grille de données, vous devrez peut-être modifier le type de liaison ou un champ de liaison utilisé dans la condition de liaison. Si vous suspectez une discordance entre les champs dans la liaison, utilisez un calcul à la place. Pour plus d'informations, voir Utiliser des calculs pour résoudre les discordances entre des champs dans une liaison.

  • Données en double : Vous pouvez prendre les mesures suivantes si vous constatez la présence de données en double. Envisagez de modifier l'agrégation de la mesure utilisée dans votre analyse, utilisez un calcul ou utilisez la fusion des données à la place. Pour plus d'informations sur la fusion des données, consultez Fusionner vos données.

  • Données manquantes : S'il manque des données dans la grille de données, vous devrez peut-être modifier le type de liaison ou un champ de liaison utilisé dans la condition de liaison. À nouveau, si vous suspectez une discordance entre les champs dans la liaison, utilisez un calcul à la place. Pour plus d'informations, voir Utiliser des calculs pour résoudre les discordances entre des champs dans une liaison.

  • Nombreuses valeurs null : Si vous voyez de nombreuses valeurs null inattendues, vous devrez peut-être modifier le type de liaison du type externe entier au type interne.

  • Toutes les valeurs null pour une table : Si toutes les valeurs d'une table sont null, il n'existe aucune correspondance entre les tables que vous liez. Si cette situation est inattendue, envisagez de modifier le type de liaison.

Utiliser des calculs pour résoudre les discordances entre des champs dans une liaison

En cas de discordance des champs dans une condition de liaison (discordance entre les valeurs des champs utilisés dans une condition de liaison), la grille des données peut afficher peu de données ou aucune donnée. Une discordance entre les champs peut se produire pour plusieurs raisons, mais elle est souvent provoquée par des différences de format des chaînes de données ou des valeurs de date dans les champs. Dans de nombreux cas, vous pouvez résoudre les discordances entre les champs de votre liaison en utilisant un calcul.

Vous pouvez utiliser la plupart des fonctions dans un calcul pour créer et remplacer un champ dans la condition de liaison, à l'exception des fonctions d'agrégation et des fonctions de calcul de table.

Remarque :Les calculs de jointure ne sont pas pris en charge par QuickBooks Online, Marketo, Oracle Eloqua, Anaplan, ServiceNow ITSM et les connecteurs de données Web.

Discordance de chaîne

Un scénario de discordance courant en cas d'utilisation de données de chaîne se présente lorsque l'un des champs sur un côté de la condition de liaison équivaut à deux champs ou plus de l'autre côté de la condition de liaison. Dans ce cas, vous pouvez utiliser un calcul pour combiner les deux champs afin que leur format corresponde à l'autre champ dans la condition de liaison.

Par exemple, supposons que vous souhaitiez lier deux tables contenant les données suivantes :

Patron Contact
Prénom Nom Filiale Membre depuis Unités empruntées Frais Limite suggérée
Alan

Wang

Nord 2000 1 0 15
Andrew Smith Nord 2000 36 3.50 15
Ashley Garcia Sud 2000 243 11.30 15
Fred Suzuki Nord 2000 52 .90 15
Nom N° de membre Contact d'urgence Relation N° d'urgence
Adam Davis 555-0324 Ellen Davis Partenaire 555-0884
Alan Wang 555-0356 Jean Wilson Mère 555-0327
Fred Suzuki 555-0188 Jim Suzuki Frère 555-3188

Henry Wilson

555-0100 Laura Rodriquez Partenaire 555-0103
Michelle Kim 555-0199 Steven Kim Partenaire 555-0125

Les champs communs entre les deux tables semblent être le nom. Toutefois, dans le tableau Patron, le prénom et le nom sont dans des colonnes séparées, et dans le tableau Filiale, les noms et prénoms figurent dans la même colonne. Pour lier ces tables sur la base des noms, vous pouvez utiliser un calcul sur le côté gauche de la condition de liaison afin de fusionner les colonnes de prénom et de nom.

Le résultat est un champ calculé sur le côté gauche de la condition de liaison, qui est accessible uniquement à partir de la boîte de dialogue de liaison. Ce calcul convertit le champ dans le tableau Patron dans un format qui correspond désormais au format du champ dans le tableau Contact sur le côté droit de la condition de liaison.

L'utilisation du calcul dans la liaison produit la table combinée suivante : 

Prénom Nom Filiale Membre depuis Unités empruntées Frais Limite suggérée Nom Numéro de téléphone
Alan Wang Nord 2000 1 0 15 Alan Wang 555-0356
Fred Suzuki Nord 2000 52 .90 15 Fred Suzuki 555-0188

Discordance de date

Un scénario de discordance courant en cas d'utilisation de données de date se présente lorsque les valeurs de date sur un champ de la condition de liaison sont capturées à un niveau de détail différent de l'autre champ dans la condition de liaison. Dans ce cas, vous pouvez utiliser un calcul dans la condition de liaison pour modifier le format du champ sur un côté de la condition de liaison afin que son format corresponde à l'autre champ dans la condition de liaison.

Supposons, par exemple, que vous ayez les deux tables de données suivantes :

Location de projecteur Patron
Date Type de réservation ID du demandeur

1/1/2000

Individuel 233445589
1/28/2002 K-12 365948999
1/29/2002 Non lucratif 233448888
12/5/2002 K-12 365948999
05/05/2003 Non lucratif 334015476
3/12/2004

Non lucratif

334015476
3/15/2006 Ville 211896980
7/8/2007 K-12 334015476
1/4/2008 Individuel 560495523
3/8/2009 Non lucratif 233445566
2/14/2014

Non lucratif

233445566
12/21/2015 Non lucratif 233445566
2/10/2016 Non lucratif 233445566
ID Prénom Nom Filiale Membre depuis Unités empruntées Frais Limite suggérée
454613981 Adam Davis West 2012 25 0 10
232502870 Alan

Wang

Nord 2000 1 0 15
298000916 Amanda Smith Nord 2001 54 6.4 15
233448978 Andrew Smith Nord 2000 36 3.50 15
233445566 Ashley Garcia Sud 2000 243 11.30 15
900005122 Brian Frank Est 2011 12 .10 10
921491769 Elizabeth Johnson West 2010 19 .5 10
233445589 Fred Suzuki Nord 2000 52 .90 15
344556677 Henry Wilson Sud 2005 3 .2 15
939502870 Jane Johnson West 2017 0 0 10

Pour plus d'informations entre le comportement du nouveau client, vous pouvez lier la table Client et la table Location de projecteur pour en savoir plus sur les services de bibliothèque qui suscitent de nouvelles adhésions. Les champs communs entre les deux tables semblent être "Date" et "Membre depuis". Par contre, les valeurs de date dans chaque champ sont capturées à des niveaux de détail différents. Pour lier ces tables selon leurs champs de dates respectives, utilisez une combinaison de fonctions DATE dans un calcul de chaque côté de la condition de liaison pour créer le niveau de détail dans chaque correspondance de champ.

L'utilisation du calcul dans la liaison produit la table combinée suivante :

Date Type de réservation ID du demandeur ID Prénom Nom Filiale Membre depuis Unités empruntées Frais Limite suggérée

1/1/2000

Individuel 233445589 232502870 Alan Wang

Nord

2000 1 0.00 15
1/1/2000 Individuel 233445589 233445589 Fred Suzuki Nord 2000 52 0.90 15
1/1/2000 Individuel 233445589 233445566 Ashley Garcia Sud 2000 243 11.30 15
1/1/2000 Individuel 233445589 233448978 Andrew Smith Nord 2000 36 3.50 15

Pour déterminer si un client a loué le projecteur la même année qu'il a démarré son adhésion, ajoutez une clause supplémentaire à la liaison basée sur l'ID.

Le résultat de la condition de liaison supplémentaire montre que seul un client peut avoir démarré son adhésion pour louer un projecteur.

Date Type de réservation ID du demandeur ID Prénom Nom Filiale Unités liées Unités empruntées Frais Limite suggérée
1/1/2000 Individuel 233445589 233445589 Fred Suzuki Nord 2000 52 0.90 15

Résolution des problèmes de liaison

Valeurs biaisées (en positif) ou valeurs dupliquées

Lorsque vous vous connectez à plusieurs tables et que vous les liez, vous créez une vue dénormalisée des données. Dans certains cas, Tableau traite plusieurs tables comme une seule table. Lorsque plusieurs tables sont traitées comme une seule table, une fois que toutes les tables sont liées, toutes les tables sont interrogées. Il peut en résulter des valeurs biaisées (en positif).

Par exemple, supposons que vous ayez deux tables. La première table contient des informations sur les employés telles que l'ID d'employé et un salaire. La seconde table contient des informations organisationnelles telles que des noms de services.

Table 1

ID d'employé Nom Salaire
20106 Kim, Michelle 63 000
20107 Wilson, Henry 61 000
20108 Smith, Andrew 65 000

Table 2

Service Date d'embauche ID d'employé Entreprise
Développement 16/06/2016 20289 Stratégie
Assistance 28/07/2015 20107 Opérations
Assistance 05/08/2016 20299 Opérations
Ventes 25/08/2016 20107 Opérations

Si vous liez ces tables sur Employee ID, le salaire de l'employé est comptabilisé plus d'une fois, car l'employé est associé à plusieurs services.

ID d'employé Nom Salaire Service Date d'embauche Entreprise
20107 Wilson, Henry 61 000 Assistance 28/07/2015 Opérations
20107 Wilson, Henry 61 000 Ventes 25/08/2016 Opérations

Vous pouvez résoudre ce problème comme suit :

  • Modifier l'agrégation : selon votre analyse, vous pouvez utiliser l'agrégation MIN ou AVG pour supprimer la double comptabilisation.

    Par exemple, si vous changez l'agrégation Salary de SUM en MIN ou de SUM en AVG.

  • Créez un champ calculé qui supprime les valeurs en double : vous pouvez créer un champ calculé qui divise la somme du champ dupliqué par le nombre d'instances du champ à la source de la duplication.

    Par exemple, les valeurs Salary sont dupliquées par le nombre d'instances d'Employee ID pour Wilson, Henry. Dans ce cas, dans la vue, remplacez Salary par un champ calculé utilisant les formules suivantes : SUM ([Salary])/ COUNT ([Employee ID]).

    Vous pouvez aussi utiliser une expression de niveau de détail pour supprimer les données en double. Pour plus d'informations, consultez Supprimer les données en double avec les calculs LOD dans la Base de connaissances Tableau.

  • Fusionner les données : au lieu de créer une liaison, ce qui peut dupliquer vos données, vous pouvez fusionner les données sur un champ commun à la place. Pour plus d'informations, consultez Fusionner vos données.

  • Utiliser SQL personnalisé : Tableau prend en charge SQL personnalisé pour connecter plusieurs tables d'une source de données. Vous pouvez pré-agréger les tables avant de les lier avec une clause GROUP BY. Cette option nécessite de savoir rédiger des requêtes SQL et de faire appel à un expert des bases de données si possible. Pour plus d'informations sur la connexion à une requête SQL personnalisée depuis Tableau, voir Se connecter à une requête SQL personnalisée.

Liaisons interrompues entre des bases de données

Avant de lier des tables à l'aide d'une liaison entre des bases de données, assurez-vous que les types de données des clés de liaison correspondent. Si les types de données des clés de liaison ne correspondent pas, la liaison se rompt, ce qui est indiqué par un point d'exclamation rouge. Pour réparer une liaison rompue, suivez l'une des suggestions suivantes :

  • Vous pouvez modifier le format d'un champ (y compris son type de données) dans la boîte de dialogue de liaison pour que les clés de liaison correspondent en créant un calcul de liaison. Un calcul de liaison prend en charge un sous-ensemble de calculs qui vous permet de modifier le format d'une clé de liaison dans une ou plusieurs tables que vous souhaitez combiner. Pour créer un calcul de liaison, cliquez sur la relation de liaison entre les tables qui présentent une liaison rompue, cliquez sur le champ dont le format doit être modifié, puis sélectionnez Créer un calcul de liaison. Pour plus d'informations, voir Utiliser des calculs pour résoudre les discordances entre des champs dans une liaison.

  • Pour des données textuelles ou Excel, modifiez le type de données de l'un des champs de texte ou Excel dans la clé de liaison à l'aide du menu Type de données situé dans la grille de données.

  • Tableau Desktop uniquement : Pour la plupart des connexions, vous pouvez utiliser l'option Convertir en SQL personnalisé pour modifier le type de données de l'un des champs dans la clé de liaison en utilisant une fonction telle que CAST (). L'option Convertir en SQL personnalisé n'est disponible que si la source de données contient une seule connexion. Dans ce cas, supprimez la seconde connexion puis sélectionnez Données > Convertir en SQL personnalisé.

Autres articles de cette section