Se connecter aux données

Pour utiliser Tableau Prep Builder afin de nettoyer et de préparer vos données, démarrez un nouveau flux en vous connectant à vos données, comme dans Tableau Desktop. Vous pouvez également ouvrir un flux existant et reprendre là vous vous étiez arrêté.

Vous pouvez voir vos flux les plus récents et y accéder dans la page de démarrage, et donc retrouver facilement votre travail en cours. Après vous être connecté à vos données, utilisez les différentes options de l'étape des données entrantes pour identifier les données avec lesquelles travailler dans votre flux.

Démarrer ou ouvrir un flux

Tableau Prep Builder prend en charge les connexions aux types de données courants ainsi qu'aux extraits de données Tableau (.tde ou .hyper). Les connecteurs pris en charge dans Tableau Desktop ne le sont peut-être pas encore dans votre version de Tableau Prep Builder. Par contre, de nouveaux connecteurs sont ajoutés avec chaque nouvelle version. Vérifiez donc le volet Connexions pour voir si votre connecteur est disponible.

Remarque : si vous ouvrez un flux dans une version où le connecteur n'est pas pris en charge, le flux peut s'ouvrir mais risque de présenter des erreurs ou de ne pas s'exécuter, à moins que les connexions de données ne soient supprimées.

Vous pouvez aussi utiliser les requêtes SQL personnalisées pour vous connecter aux données comme vous le faites actuellement dans Tableau Desktop. Pour plus d'information, consultez Se connecter à une requête SQL personnalisée dans l'aide de Tableau Desktop et l'aide de la création Web.

Pour vérifier si vous pouvez vous connecter à vos données, ouvrez Tableau Prep Builder et cliquez sur le bouton Ajouter une connexion pour voir si un connecteur pour vos données figure dans le volet gauche sous Connexion.

Remarque : certains connecteurs peuvent nécessiter le téléchargement et l'installation d'un pilote avant que vous puissiez vous connecter aux données. Consultez la page Téléchargement de pilotes sur le site Web de Tableau pour obtenir les liens de téléchargement et les instructions d'installation.

Connexion à SAP HANA (version 2019.2.1 et ultérieur)

Tableau Prep Builder prend en charge la connexion aux données à l'aide de SAP HANA, comme Tableau Desktop, mais avec quelques différences. Connectez-vous à la base de données à l'aide de la même procédure que celle utilisée dans Tableau Desktop. Pour plus d'informations, consultez SAP HANA. Après vous être connecté et avoir recherché votre table, faites glisser la table vers l'espace de travail pour commencer à créer votre flux.

Les invites liées aux variables et aux paramètres lors de l'ouverture d'un flux ne sont pas prises en charge dans Tableau Prep Builder. Au lieu de cela, dans le volet Entrée, cliquez sur l'onglet Variables et paramètres et sélectionnez les variables et les opérandes que vous souhaitez utiliser, puis faites votre choix dans une liste de valeurs prédéfinies ou entrez des valeurs personnalisées pour interroger votre base de données et renvoyer les valeurs dont vous avez besoin.

Remarque : depuis la version 2019.2.2 de Tableau Prep Builder, vous pouvez utiliser SQL initial pour interroger votre connexion et, si vous avez plusieurs valeurs pour une variable, vous pouvez sélectionner la valeur dont vous avez besoin dans une liste déroulante.

Vous pouvez également ajouter des variables supplémentaires. Cliquez sur le bouton plus dans la section Variables et sélectionnez une variable et un opérande, puis entrez une valeur personnalisée.

Remarque : ce connecteur n'est pas pris en charge dans Tableau Prep Conductor version 2019.1. Si vous créez un flux qui utilise ce connecteur, vous pouvez publier le flux mais vous ne pourrez pas exécuter le flux à l'aide des fonctionnalités de programmation dans Tableau Server. Au lieu de cela, vous pouvez exécuter le flux à l’aide de l’interface en ligne de commande pour conserver vos données à jour. Pour plus d'informations sur l'exécution de flux depuis la ligne de commande consultez Actualiser les fichiers de sortie depuis la ligne de commande. Pour plus d'informations sur la compatibilité des versions, consultez Compatibilité de version avec Tableau Prep.

Connexion à l'aide d'ODBC (version 2019.2.2 et ultérieur)

Si vous avez besoin de vous connecter à des sources de données ne figurant pas dans le volet Connexions, vous pouvez vous connecter à n'importe quelle source de données avec le connecteur Autres bases de données (ODBC) qui prend en charge la norme SQL et implémente l'API ODBC. La connexion aux données à l'aide du connecteur Autres bases de données (ODBC) fonctionne comme dans Tableau Desktop, à quelques différences près :

  • Vous ne pouvez vous connecter qu'avec l'option DSN (nom de la source de données).

  • Pour publier et exécuter votre flux dans Tableau Server, le serveur doit être configuré avec un DSN correspondant.

    Remarque : l'exécution, depuis la ligne de commande (Tableau Prep Builder), de flux qui incluent le connecteur Autres bases de données (ODBC) n'est pas prise en charge actuellement.

  • Il existe une expérience de connexion unique à la fois pour Windows et MacOS. Les invites liées aux attributs de connexion pour les pilotes ODBC (Windows) ne sont pas prises en charge.

  • Seuls les pilotes 64 bits sont pris en charge par Tableau Prep Builder.

Avant de vous connecter

Pour vous connecter à vos données à l'aide du connecteur Autres bases de données (ODBC), vous devez installer le pilote de base de données et configurer votre DSN (nom de la source de données). Pour publier et exécuter des flux vers Tableau Server, le serveur doit également être configuré avec un DSN correspondant.

Important : Tableau Prep Builder ne prend en charge que les pilotes 64 bits. Si vous avez déjà installé et configuré un pilote 32 bits, vous devrez peut-être le désinstaller, puis installer la version 64 bits si le pilote n'autorise pas l'installation simultanée des deux versions.

  1. Créez un DSN à l'aide de l'Administrateur de source de données ODBC (64 bits) (Windows) ou de l'utilitaire ODBC Manager (MacOS).

    Si l'utilitaire n'est pas installé sur votre Mac, vous pouvez en télécharger un depuis (www.odbcmanager.net par exemple) ou vous pouvez modifier manuellement le fichier odbc.ini.

  2. Dans l'Administrateur de sources de données ODBC (64 bits) (Windows) ou dans l'utilitaire ODBC Manager (MacOS), ajoutez une nouvelle source de données, sélectionnez le pilote de la source de données et cliquez sur Terminer.

  3. Dans la boîte de dialogue Configuration du pilote ODBC, saisissez les informations de configuration telles que le nom du serveur, le port, le nom d'utilisateur et le mot de passe. Cliquez sur Tester (si votre boîte de dialogue comporte cette option) pour vérifier que votre connexion est correctement établie, puis enregistrez votre configuration.

    Remarque : Tableau Prep Builder ne prenant pas en charge les invites liées aux attributs de connexion, vous devez donc définir ces informations lors de la configuration du DNS.

    Cet exemple montre la boîte de dialogue de configuration d'un connecteur MySQL.

Connexion à l'aide d'autres bases de données (ODBC)

  1. Ouvrez Tableau Prep Builder et cliquez sur le bouton Ajouter une connexion .

  2. Dans la liste des connecteurs, sélectionnez Autres bases de données (ODBC).

  3. Dans la boîte de dialogue Autres bases de données (ODBC), sélectionnez un DSN dans la liste déroulante et entrez le nom d'utilisateur et le mot de passe. Cliquez ensuite sur Connexion.

  4. Dans le volet Connexions, sélectionnez votre base de données dans la liste déroulante.

Utiliser SQL initial pour interroger vos connexions (version 2019.2.2 et ultérieur)

Vous pouvez spécifier une commande SQL initiale lors de la connexion aux bases de données qui la prennent en charge. Elle s'exécutera lorsqu'une connexion est établie à la base de données. Par exemple, lorsque vous vous connectez à Amazon Redshift, vous pouvez entrer une instruction SQL pour appliquer un filtre lors de la connexion à la base de données de la même manière que vous ajoutez des filtres à l'étape des données entrantes. La commande SQL s'appliquera avant que les données soient échantillonnées et chargées dans Tableau Prep Builder.

Pour actualiser vos données et exécuter à nouveau la commande SQL initiale, effectuez l'une des opérations suivantes :

•Modifiez la commande SQL initiale et actualisez l'étape des données entrantes.

•Exécutez le flux. La commande SQL initiale est exécutée avant le traitement de toutes les données.

•Planifiez le flux à exécuter sur Tableau Server. La commande SQL initiale est exécutée à chaque exécution du flux, dans le cadre du chargement des données.

  1. Dans le volet Connexions, sélectionnez, dans la liste, un connecteur prenant en charge SQL initial.
  2. Cliquez sur le lien Afficher SQL initial pour développer la boîte de dialogue et entrer vos instructions SQL.

Important : les paramètres ne sont pas encore pris en charge pour SQL initial dans Tableau Prep Builder. Si vous essayez d'entrer des paramètres comme vous le feriez dans Tableau Desktop, des erreurs s'afficheront.

Utiliser les extraits de données Tableau

Lorsque vous vous connectez à un extrait de données Tableau, Tableau Prep Builder décompresse les extraits hyper en utilisant beaucoup d'espace temporaire puisqu'il applique vos opérations de flux aux données brutes résultantes.

Cela signifie que vous pouvez avoir besoin de plus de RAM et d'espace disque pour gérer un fichier de cette taille. Par exemple, un fichier d'extrait comportant 18 colonnes et 1,2 millions de lignes d'une taille de 360 Mo (8,5 Go non compressés) peut nécessiter jusqu'à 32 Go de RAM, 16 cœurs et 500 Go d'espace disque disponible pour prendre en charge le fichier lorsqu'il est décompressé.

Démarrer un nouveau flux

  1. Ouvrez Tableau Prep Builder et cliquez sur le bouton Ajouter une connexion .

  2. Dans la liste des connecteurs, sélectionnez le type de fichier ou le serveur hébergeant vos données. Si vous y êtes invité, entrez les informations de connexion et accédez à vos données.

  3. Dans le volet Connexions, effectuez l'une des opérations suivantes :

    • Si vous êtes connecté à un fichier, double-cliquez sur une table ou faites-la glisser sur le volet Flux pour démarrer votre flux.

      Pour les tables simples, Tableau Prep Builder crée automatiquement une étape des données entrantes pour vous dans le volet Flux lorsque vous ajoutez des données à votre flux.

    • Si vous vous êtes connecté à une base de données, sélectionnez une base de données ou un schéma, puis double-cliquez sur une table ou faites-la glisser sur le volet Flux pour démarrer votre flux.

Ouvrir un flux existant

Pour ouvrir un flux existant, dans la page de démarrage, effectuez l'une des opérations suivantes :

  • Sous Flux récents, sélectionnez un flux.

  • Cliquez sur Ouvrir un flux pour accéder à votre fichier de flux, et ouvrez-le.

Cliquez sur Fichier > Nouveau pour ouvrir un nouvel espace de travail.

Actualiser les données dans l'étape des données entrantes

Si des données changent dans vos fichiers ou tables d'entrée après que vous avez commencé à travailler avec votre flux, vous pouvez actualiser l'étape des données entrantes de manière à intégrer les nouvelles données.

Utilisez l'une des options suivantes :

  • Dans le volet Flux sur le menu supérieur, cliquez sur le bouton Actualiser pour actualiser toutes les étapes de données entrantes. Pour actualiser une seule étape de données entrantes, cliquez sur la flèche déroulante à côté du bouton d'actualisation et sélectionnez l'étape des données entrantes dans la liste.

  • Dans le volet Flux, faites un clic droit sur l'étape des données entrantes que vous souhaitez actualiser et sélectionnez Actualiser dans le menu.

  • Supprimez l'étape des données entrantes puis ajoutez-la à nouveau au flux.

    1. Dans le volet Flux, faites un clic droit sur l'étape des données entrantes que vous souhaitez actualiser, puis sélectionnez Supprimer dans le menu.

      Votre flux sera alors provisoirement dans un état d'erreur.

    2. Reconnectez-vous au fichier mis à jour.

    3. Faites glisser la table vers le volet Flux en haut de la seconde étape du flux où vous souhaitez ajouter l'étape des données entrantes. Déposez-la sur l'option Ajouter pour la reconnecter au flux.

Utiliser l'Interpréteur de données pour nettoyer vos fichiers

Lorsque vous travaillez avec des fichiers Microsoft Excel, vous pouvez utiliser l'Interpréteur de données pour détecter les sous-tables dans vos données et supprimer les informations superflues afin de préparer vos données pour l'analyse. Lorsque vous activez l'Interpréteur de données, il détecte ces sous-tables et les répertorie en tant que nouvelles tables dans la section Tables du volet Connexions.

Vous pouvez aussi les déposer dans le volet Flux. Si vous utilisez Tableau Prep Builder version 2018.1.2 ou versions ultérieures, vous pouvez sélectionner l'option Union avec caractère générique dans l'onglet Plusieurs fichiers pour inclure toutes les sous-tables détectées dans votre flux. Pour plus d'informations sur l'utilisation de l'union avec caractères génériques dans l'étape des données entrantes, consultez Réunir des fichiers et des tables de base de données dans l'étape des données entrantes.

Si vous désactivez l'Interpréteur de données, ces tables sont supprimées du volet Connexions. Si ces tables sont déjà utilisées dans le flux, il en résulte des erreurs de flux provenant des données manquantes.

Remarque : actuellement, l'interpréteur de données détecte uniquement les sous-tables dans vos feuilles de calcul Excel et ne prend pas en charge la spécification de la ligne de départ pour les fichiers texte et les feuilles de calcul.

L'exemple ci-dessous montre les résultats de l'utilisation de l'Interpréteur de données pour une feuille de calcul Excel dans le volet Connexions. L'Interpréteur de données a détecté deux sous-tables supplémentaires.

Avant l'Interpréteur de données Après l'Interpréteur de données

Pour utiliser l'Interpréteur de données, complétez les étapes suivantes :

  1. Sélectionnez Se connecter aux données puis sélectionnez Microsoft Excel.

  2. Sélectionnez votre fichier et cliquez sur Ouvrir.

  3. Activez la case à cocher Utiliser l'interpréteur de données.

  4. Faites glisser la nouvelle table vers le volet Flux pour l'inclure dans votre flux. Pour supprimer l'ancienne table, faites un clic droit sur l'étape des données entrantes pour l'ancienne table, et sélectionnez Supprimer.

Réunir des fichiers et des tables de base de données dans l'étape des données entrantes

Lorsque vous travaillez avec plusieurs fichiers ou tables de base de données depuis une source de données unique, vous pouvez rechercher des fichiers ou des tables en lançant une recherche avec caractères génériques, puis réunir les données de manière à inclure toutes ces données de fichiers et de tables dans l'étape des données entrantes. Pour pouvoir être réunis, les fichiers doivent être dans le même répertoire parent ou enfant.

Pour réunir des tables de données, les tables doivent être dans la même base de données et la connexion à la base de données doit prendre en charge l'union avec caractères génériques. Les bases de données suivantes prennent en charge ce type d'union :

  • Amazon Redshift

  • Microsoft SQL Server

  • MySQL

  • Oracle

  • PostgreSQL

Si vous ajoutez ou supprimez des fichiers ou des tables après avoir créé l'union, vous pouvez actualiser l'étape des données entrantes de manière à mettre à jour votre flux avec les données nouvelles ou modifiées.

Remarque : à l'heure actuelle, cette fonction s'applique uniquement aux fichiers Excel et .csv (texte), et aux tables de données stockées dans des bases de données spécifiques recensées ci-dessus. Cette option n'est pas disponible pour les extraits de données Tableau.

L'union avec caractère générique pour les fichiers est disponible dans Tableau Prep version 2018.1.2 et versions ultérieures. L'union avec caractère générique pour les tables de base de données est disponible dans Tableau Prep version 2018.3.1 et versions ultérieures. La modification d'une connexion au flux avec ce type d'union dans une version antérieure peut générer des erreurs.

Si vous avez besoin de réunir des données à partir de sources de données différentes, vous pouvez le faire à l'aide de l'étape Union. Pour plus d'informations sur la création des étapes Union, consultez Lier ou réunir des données.

Réunir des fichiers

Par défaut, Tableau Prep Builder réunit tous les fichiers .csv dans le même répertoire que le fichier .csv auquel vous êtes connecté ou toutes les feuilles du fichier Excel auquel vous êtes connecté. Si vous utilisez l'Interpréteur de données pour nettoyer des fichiers Excel et que vous utilisez Tableau Prep Builder version 2018.1.2 ou ultérieure, vous pouvez utiliser la recherche avec caractère générique pour réunir et ajouter les sous-tables que l'Interpréteur de données a trouvées.

Si vous souhaitez modifier l'union par défaut, utilisez les critères suivants pour trouver les fichiers ou les feuilles à inclure dans l'union :

  • Rechercher dans : sélectionnez le répertoire à utiliser pour rechercher des fichiers. Sélectionnez la case à cocher Inclure les sous-dossiers pour inclure les fichiers dans le sous-répertoire du dossier parent.

  • Fichiers : choisissez d'inclure ou d'exclure les fichiers correspondant aux critères de la recherche avec caractères génériques.

  • Modèle de correspondance (xxx*) : entrez un modèle de recherche avec caractères génériques pour trouver les fichiers contenant ces caractères dans le nom de fichier. Par exemple, si vous avez entré ord*, tous les fichiers incluant le nom de fichier sont retournés. Laissez ce champ vide pour inclure tous les fichiers du répertoire spécifié.

Si vous souhaitez utiliser la recherche avec caractères génériques pour réunir des fichiers :

  1. Cliquez sur le bouton Ajouter une connexion et sous Connexion, cliquez sur Fichier texte pour les fichiers .csv ou sur Microsoft Excel pour les fichiers Excel, puis sélectionnez un fichier à ouvrir.

  2. Dans le volet Entrée, sélectionnez l'onglet Plusieurs fichiers puis sélectionnez Union avec caractères génériques.

    L'exemple ci-dessous montre une union avec caractères génériques utilisant un modèle de correspondance. Le signe plus dans l'icône du fichier à l'étape des données entrantes Orders_Central dans le volet Flux indique que cette étape inclut une union avec caractères génériques. Les fichiers de l'union sont répertoriés sous Fichiers inclus.

  3. Utilisez les options de recherche, de fichier et de modèle de correspondance pour trouver les fichiers que vous souhaitez réunir.

  4. Cliquez sur Appliquer pour réunir les fichiers.

Lorsque vous ajoutez une nouvelle étape au flux, vous pouvez voir tous les fichiers ajoutés à l'ensemble de données dans le champ Chemins d'accès des fichiers dans le volet Profil. Ce champ est ajouté automatiquement.

Réunir des tables de base de données (version 2018.3.1 et ultérieur)

  1. Cliquez sur le bouton Ajouter une connexion et sous Connexion,connectez-vous à une base de données prenant en charge l'union avec caractères génériques.

  2. Faites glisser une table vers le volet Flux.

  3. Dans le volet Entrée, sélectionnez l'onglet Plusieurs tables, puis sélectionnez Union avec caractères génériques.

  4. Utilisez les options de recherche, Tables et Modèle de correspondance pour trouver les tables que vous souhaitez réunir.

    Seules les tables qui s'affichent dans le volet Connexions dans la section Tables peuvent être incluses dans l'union. La recherche avec caractères génériques ne peut pas effectuer de recherche dans des schémas ou dans la connexion à des bases de données pour trouver des tables.

  5. Cliquez sur Appliquer pour réunir les données de table.

    Lorsque vous ajoutez une nouvelle étape au flux, vous pouvez voir toutes les tables ajoutées à l'ensemble de données dans le champ Noms des tables dans le volet Profil. Ce champ est ajouté automatiquement.

Fusionner des champs après une union

Après avoir créé une union dans l'étape des données entrantes, vous souhaiterez peut-être fusionner les champs. Vous pouvez le faire dans toute étape suivante, sauf pour les étapes Entrée ou Sortie. Pour plus d'informations, consultez Options supplémentaires de fusion des champs.

Utiliser des relations entre tables existantes pour lier des données

Dans Tableau Prep Builder version 2019.1.3 et versions ultérieures, lorsque vous vous connectez à des bases de données qui incluent des tables avec des données de relation, Tableau Prep Builder peut désormais détecter et afficher les champs d'une table identifiés comme identificateur unique (clé primaire) et les champs identifiés comme un champ associé (clé étrangère), ainsi que les noms de tables associées pour ces champs.

Une nouvelle colonne appelée Clés liées apparaît dans le volet Entrée et affiche les relations suivantes, le cas échéant :

  • Identificateur unique. Ce champ identifie de manière unique chaque ligne du tableau. Une table peut contenir plusieurs identificateurs uniques. Les valeurs des champs doivent être uniques et ne peuvent pas être vides ou null.

  • Champ associé (également appelé clé étrangère). Ce champ associe la table à une autre table dans la base de données. Une table peut comporter plusieurs champs associées.

  • À la fois identificateur unique et champ associé. Le champ est un identificateur unique dans cette table et il associe également la table à une autre table dans la base de données.

Vous pouvez utiliser ces relations pour trouver et ajouter rapidement les tables associées à votre flux ou créer des jointures à partir de l'étape des données entrantes. Cette fonctionnalité est disponible pour tous les connecteurs de base de données pris en charge dans lesquels des relations entre tables sont définies.

  1. Connectez-vous à une base de données (par exemple Microsoft SQL Server) qui contient des données de relation pour des champs, par exemple des identificateurs uniques ou des champs associés (clé étrangère).
  2. Dans le volet Entrée, cliquez sur un champ marqué comme champ associé ou comme , à la fois un identificateur unique et un champ associé.

    Une boîte de dialogue affiche la liste des tables associées.

  3. Pointez sur la table que vous souhaitez ajouter ou lier, et cliquez sur le bouton Plus pour ajouter la table à votre flux. Sinon, cliquez sur le bouton Lier pour créer une jointure avec la table sélectionnée.

    Si vous créez une jointure, Tableau Prep Builder utilise la relation de champ définie pour lier les tables et vous présente un aperçu des clauses de jointure qu'il utilisera pour créer la jointure.

  4. Vous pouvez également lier des tables associées à partir du menu du volet Flux. Survolez une étape jusqu'à ce que l'icône Plus s'affiche, puis sélectionnez Ajouter une jointure pour afficher la liste des tables associées. Tableau Prep Builder crée la jointure en fonction des champs qui constituent la relation entre les deux tables.

    Remarque : si aucune relation entre tables n'est définie pour votre table, cette option n'est pas disponible.

Pour plus d'informations sur l'utilisation des jointures, consultez Lier vos données.

Configurer votre ensemble de données

Pour déterminer la proportion de votre ensemble de données à inclure dans le flux, vous pouvez configurer votre ensemble de données. Lorsque vous vous connectez à vos données ou que vous faites glisser des tables dans le volet Flux, une étape des données entrantes est ajoutée automatiquement au flux. Ceci est toujours la première étape de votre flux. Vous pouvez faire un clic droit sur l'étape des données entrantes pour la renommer ou la supprimer. Si vous êtes connecté à un fichier Excel ou texte, vous pouvez également actualiser les données de l'étape des données entrantes.

Dans l'étape des données entrantes, vous pouvez voir le profil des métadonnées pour votre ensemble de données. C'est ici que vous pouvez rechercher des champs, consulter des échantillons de valeurs et prendre des mesures pour réduire la taille de votre ensemble de données, par exemple en sélectionnant les champs à inclure, en sélectionnant l'échantillon de données avec lequel travailler, ou en appliquant des filtres aux champs ou lignes sélectionnés.

Vous pouvez également configurer les propriétés du champ en modifiant le type de données ou le nom du champ pour les champs. Pour les fichiers texte, vous pouvez également configurer les paramètres du texte.

Remarque : les crochets dans les valeurs de champ sont automatiquement convertis en parenthèses.

Se connecter à une requête SQL personnalisée

Si votre base de données prend en charge SQL personnalisé, vous verrez s'afficher SQL personnalisé s'afficher près du bas du volet Connexions. Double-cliquez sur SQL personnalisé pour ouvrir l'onglet SQL personnalisé où vous pouvez entrer des requêtes pour présélectionner les données et utiliser des opérations spécifiques aux sources. Une fois que la requête a récupéré les données, vous pouvez sélectionner les champs à inclure, appliquer des filtres, ou modifier le type de données avant d'ajouter les données à votre flux.

Pour plus d'informations sur l'utilisation de SQL personnalisé, consultez Se connecter à une requête SQL personnalisée dans l'aide de Tableau Desktop et l'aide de la création Web.

Sélectionner les champs à inclure dans le flux

Le volet Entrée affiche une liste des champs de votre ensemble de données. Vous pouvez utiliser le champ Rechercher pour rechercher des champs dans la liste puis utiliser les cases à cocher pour sélectionner les champs à inclure ou à exclure. Pour inclure ou exclure tous les champs du flux, basculez la case à cocher en haut à gauche de la grille.

Configurer les propriétés des champs

Lorsque vous travaillez avec des fichiers texte, vous voyez s'afficher un onglet Paramètres du texte où vous pouvez modifier votre connexion et configurer les propriétés du texte, par exemple le séparateur de champs pour les fichiers texte. Vous pouvez également modifier la connexion aux fichiers dans le volet Connexions.

Lorsque vous travaillez avec des fichiers texte ou Excel, vous pouvez corriger les types de données qui ont été incorrectement induits avant que vous commenciez votre flux. Les types de données peuvent toujours être modifiés par étapes consécutives dans le volet Profil après le démarrage de votre flux.

Configurer les paramètres de texte dans les fichiers texte

Pour modifier les paramètres utilisés pour analyser les fichiers texte, faites votre choix parmi les options suivantes :

  • La première ligne contient l'en-tête (par défaut) : sélectionnez cette option pour utiliser la première ligne comme étiquettes de champs.

  • Générer les noms de champs automatiquement : sélectionnez cette option si vous souhaitez que Tableau Prep Builder génère automatiquement les en-têtes de champ. La convention de dénomination des champs suit le même modèle que Tableau Desktop, par exemple F1, F2 etc.

  • Séparateur de champs : sélectionnez un caractère dans la liste à utiliser pour séparer les colonnes. Sélectionnez Autre pour entrer un caractère personnalisé.

  • Qualificateur de texte : sélectionnez le caractère qui entoure les valeurs dans le fichier.

  • Jeu de caractères : sélectionnez le jeu de caractères qui décrit le codage du fichier texte.

  • Paramètres régionaux : sélectionnez les paramètres régionaux à utiliser pour analyser le fichier. Ce paramètre indique quelle décimale et quel séparateur de milliers utiliser.

Modifier les types de données

Pour modifier le type de données pour un champ, procédez comme suit :

  1. Cliquez sur le type de données pour le champ.

  2. Sélectionnez le nouveau type de données dans le menu.

Modifier les noms de fichiers

Pour modifier le nom d'un champ, dans la colonne Nom du champ, sélectionnez le nom, puis entrez le nouveau nom dans le champ. Une annotation est ajoutée à la grille de champs et dans le volet Flux à gauche de l'étape des données entrantes. Vos modifications sont également enregistrées dans le volet Modifications.

Définir la taille de votre échantillon de données

Par défaut, Tableau Prep Builder limite les données incluses dans le flux à un échantillon représentatif de votre ensemble de données afin de conserver des performances optimales. L'échantillon de données est déterminé en calculant le nombre optimal de lignes basé sur le nombre total de champs dans l'ensemble de données et les types de données pour ces champs. Tableau Prep Builder récupère ensuite le nombre supérieur de lignes pour le montant calculé aussi rapidement que possible.

L'échantillon de données résultant peut ou non inclure toutes les lignes dont vous avez besoin, selon la manière dont l'échantillon a été calculé et retourné. Si vous ne voyez pas les données attendues, vous pouvez modifier les paramètres de l'échantillon de données pour exécuter à nouveau la requête.

Remarque : si vos données sont échantillonnées, un indicateur Échantillonné s'affiche dans le volet Profil et persiste pour chaque étape que vous ajoutez. Toutes les modifications que vous apportez s'appliquent à l'échantillon sur lequel vous travaillez dans le flux. Toutes les modifications s'appliquent à tout l'ensemble de données lorsque vous exécutez le flux.

Pour modifier les paramètres de votre échantillon de données, sélectionnez une étape des données entrantes, puis dans l'onglet Échantillon de données, choisissez parmi les options suivantes :

  • Exemple de montant par défaut (par défaut) : Tableau Prep Builder calcule le nombre total de lignes à retourner.

  • Utiliser toutes les données : récupérez toutes les lignes de votre ensemble de données, quelle qu'en soit la taille. Ceci peut avoir une incidence sur les performances ou entraîner une expiration de délai dans Tableau Prep Builder.

    Remarque : pour préserver les performances, une limite d'échantillon de données de 1 million de lignes est toujours appliquée aux types d'étape Agréger, Lier, Réunir et Permuter, quel que soit ce paramètre.

  • Nombre fixe de lignes : sélectionnez le nombre de lignes à retourner à partir de l'ensemble de données. Le nombre de lignes recommandé est de 1 million au maximum. Définir le nombre de lignes sur plus de 1 million peut avoir une incidence sur les performances.

  • Sélection rapide (par défaut) : la base de données retourne le nombre de lignes demandées aussi rapidement que possible. Ce peut être les N premiers nombres de lignes ou les lignes que la base de données a mises en cache dans la mémoire lors 'une précédente requête.

  • Échantillon aléatoire : la base de données retourne le nombre de lignes demandées mais examine chaque ligne de l'ensemble de données et retourne un échantillon représentatif de toutes les lignes. Cette option peut avoir une incidence sur les performances lors de la récupération initiale des données.

Appliquer des filtres au champ dans l'étape des données entrantes

Pour filtrer un champ, procédez comme suit :

  1. Dans la barre d'outils, cliquez sur Filtrer les valeurs.

  2. Entrez vos critères de filtre dans l'éditeur de calcul.

Des fonctionnalités de filtrage supplémentaires sont disponibles dans d'autres étapes du flux. Pour plus d'informations, consultez Filtrer les valeurs.

Nous vous remercions de votre participation ! Une erreur s'est produite lors de la soumission de vos commentaires. Réessayez ou envoyez-nous un message.