Agrégation de données dans Tableau

Dans Tableau, vous pouvez agréger des mesures ou une dimension, bien qu'il soit plus courant d'agréger des mesures. Dès que vous ajoutez une mesure à votre vue, une agrégation est appliquée à cette mesure par défaut. Le type d'agrégation appliquée varie selon le contexte de la vue.

Visionner une vidéo : pour une illustration des concepts associés démontrés dans Tableau, visionnez Agrégation, granularité et calculs de taux, une vidéo de formation gratuite de 4 minutes. Utilisez votre compte tableau.com pour vous connecter.

Modifier l'agrégation d'une mesure dans la vue

Lorsque vous ajoutez une mesure à la vue, Tableau agrège automatiquement ces données. La somme, la moyenne et la médiane sont des agrégations courantes. Pour une liste complète, consultez Liste des agrégations prédéfinies dans Tableau.

L'agrégation active apparaît en tant que nom de la mesure dans la vue. Par exemple, Sales devient SUM(Sales). Chaque mesure possède une agrégation par défaut qui est définie par Tableau lorsque vous vous connectez à une source de données. Vous pouvez afficher ou modifier l'agrégation par défaut pour une mesure— consultez Définir l'agrégation par défaut pour une mesure.

Vous pouvez agréger des mesures à l'aide de Tableau uniquement pour des sources de données relationnelles. Les bases de données multidimensionnelles contiennent des données déjà agrégées. Dans Tableau, les sources de données multidimensionnelles sont uniquement prises en charge par Windows.

Vous pouvez modifier l'agrégation pour une mesure de la vue à partir du menu contextuel :

A graphic depicting how to change the aggregation of a measure using the field’s context menu.

Agrégation de dimensions

Vous pouvez agréger une dimension dans la vue en tant que Minimum, Maximum, Total ou Total (Distinct). Lorsque vous agrégez une dimension, vous créez une nouvelle colonne de mesures temporaire, si bien que la dimension prend les caractéristiques d'une mesure.

A graphic depicting how to aggregate a dimension using the options in the field’s context menu.

Remarque : l'agrégation Total (distinct) n'est pas prise en charge pour les sources de données Microsoft Access ni pour les sources de données Microsoft Excel et de fichiers texte utilisant l'ancienne connexion. Si vous êtes connecté à l'un de ces types de sources de données, l'agrégation Total (distinct) n'est pas disponible et la remarque "Extrait nécessaire" s'affiche. Si vous enregistrez la source de données en tant qu'extrait, vous serez en mesure d'utiliser l'agrégation Total (Distinct).

Une autre façon d'afficher une dimension est de la traiter comme un attribut. Pour ce faire, choisissez Attribut dans le menu contextuel de la dimension. L'agrégation Attribut est associée à plusieurs utilisations :

  • Elle peut assurer un niveau de détail cohérent lors de la combinaison de plusieurs sources de données.

  • Elle peut fournir un moyen d'agréger des dimensions lors du traitement de calculs de table, qui requièrent une expression agrégée.

  • Elle peut améliorer les performances des requêtes parce que le calcul est effectué localement.

Tableau calcule la valeur Attribut à l'aide de la formule suivante :

IF MIN([dimension]) = MAX([dimension]) THEN MIN([dimension]) ELSE "*" END

La formule est calculée dans Tableau une fois que les données sont récupérées à partir de la requête d'origine. En fait, l'astérisque (*) représente un indicateur visuel d'un type spécial de valeur nulle qui apparaît en présence de valeurs multiples. Consultez Résoudre les problèmes liés à la fusion des données pour en savoir plus sur l'astérisque.

L'exemple suivant illustre l'utilisation d'un attribut dans un calcul de table. La table affiche les ventes par marché, par taille du marché et par État. Imaginons que vous souhaitiez calculer le pourcentage des ventes totales que représente chaque État sur le marché. Lorsque vous ajoutez un pourcentage du total (voir Calculs de table rapides) calculé dans État, le calcul s'effectue dans la zone rouge affichée ci-dessous. Cela est dû au fait que la dimension Taille du marché partitionne les données.

Lorsque vous agrégez Market Size en tant qu'attribut, le calcul est effectué dans Market (dans l'image suivante, il s'agit du marché de l'Est) et les informations sur la taille du marché ne servent que d'étiquette au niveau de l'affichage.

Liste des agrégations prédéfinies dans Tableau

Il est parfois utile de consulter les données numériques sous une forme agrégée, par exemple en tant que somme ou moyenne. Les fonctions mathématiques produisant des données agrégées sont appelées fonctions d'agrégation. Les fonctions d'agrégation effectuent un calcul sur un ensemble de valeurs et renvoient une seule valeur. Par exemple, une mesure contenant les valeurs 1, 2, 3, 3, 4 agrégée en tant que somme renvoie une seule valeur : 13. Si vous disposez de 3 000 ventes de 50 produits dans votre source de données, il peut être intéressant d'afficher la somme des ventes de chaque produit pour pouvoir connaître ceux qui représentent le chiffre d'affaires le plus élevé.

Vous pouvez utiliser Tableau pour définir une agrégation uniquement pour les mesures dans les sources de données relationnelles. Les bases de données multidimensionnelles contiennent uniquement des données agrégées.

Remarque : L'utilisation de valeurs à virgule flottante en combinaison avec des agrégations peut parfois produire des résultats inattendus. Pour plus de détails, consultez Comprendre les types de données dans les calculs Tableau.

Tableau dispose d'un ensemble d'agrégations prédéfinies visibles dans le tableau ci-dessous. Il est possible de définir l'agrégation par défaut pour toute mesure qui n'est pas un champ calculé contenant lui-même une agrégation, par exemple AVG([Discount]). Consultez Définir l'agrégation par défaut pour une mesure Il est également possible de définir l'agrégation d'un champ déjà présent dans la vue. Pour plus de détails, consultez Modifier l'agrégation d'une mesure dans la vue.

AgrégationDescriptionRésultat pour une mesure contenant 1, 2, 2, 3
Attribut

Renvoie la valeur de l'expression donnée si elle comporte une seule valeur pour toutes les lignes du groupe. Dans le cas contraire, un astérisque (*) s'affiche. Les valeurs null sont ignorées. Cette agrégation est particulièrement utile lors de l'agrégation d'une dimension. Pour définir une mesure de la vue sur cette agrégation, cliquez avec le bouton droit de la souris (contrôle-clic sur Mac) sur la mesure, puis choisissez Attribut. Le texte est modifié et affiche désormais ATTR:

N/A
DimensionRenvoie toutes les valeurs uniques dans une mesure ou une dimension.3 valeurs (1, 2, 3)
SommeRenvoie la somme des nombres dans une mesure. Les valeurs null sont ignorées.1 valeur (8)
MoyenneRenvoie la moyenne arithmétique des nombres. Lorsqu'elle est appliquée à une dimension, Tableau crée une nouvelle colonne temporaire qui constitue une mesure (parce que le résultat d'un total est un nombre). Vous pouvez compter des nombres, des dates, des valeurs booléennes et des chaînes de caractères. Les valeurs null sont ignorées dans tous les cas.1 valeur (4)
Total (distinct)

Renvoie le nombre de valeurs uniques présentes dans une mesure ou une dimension. Lorsqu'elle est appliquée à une dimension, Tableau crée une nouvelle colonne temporaire qui constitue une mesure (parce que le résultat d'un total est un nombre). Vous pouvez compter des nombres, des dates, des valeurs booléennes et des chaînes de caractères. Les valeurs null sont ignorées dans tous les cas.

Cette agrégation n'est pas disponible pour les types de classeurs suivants :

  • Classeurs créés avant Tableau Desktop 8.2 et utilisant des sources de données de fichiers Microsoft Excel ou texte.
  • Classeurs utilisant d'anciennes connexions.
  • Classeurs utilisant des sources de données Microsoft Access.

Si vous êtes connecté à un classeur utilisant l'un de ces types, Count (Distinct) n'est pas disponible et Tableau affiche le message « Extrait nécessaire" s'affiche. Pour utiliser cette agrégation, vous devez extraire vos données. Consultez la section Extraire vos données.

1 valeur (3)
MinimumRenvoie le plus petit nombre présent dans une mesure ou une dimension continue. Les valeurs null sont ignorées.1 valeur (1)
MaximumRenvoie le nombre le plus grand dans une mesure ou dans l'expression donnée en fonction de la population d'un exemple. Les valeurs null sont ignorées. Renvoie une valeur nulle si moins de 2 membres ne sont pas nuls dans l'échantillon. Utilisez cette fonction si vos données correspondent à un échantillon de population.1 valeur (3)
Dév. Std (Pop.)Renvoie l'écart-type de toutes les valeurs de l'expression données en fonction d'une population biaisée. Suppose que ses arguments représentent la population entière. Utilisez cette fonction pour les échantillons conséquents.1 valeur (0,7071)
VarianceRenvoie la variance de toutes les valeurs dans l'expression donnée en fonction d'un échantillon. Les valeurs null sont ignorées. Renvoie une valeur nulle si moins de 2 membres ne sont pas nuls dans l'échantillon. Utilisez cette fonction si vos données correspondent à un échantillon de population.1 valeur (0,6667)
Variance (Pop.)Renvoie la variance de toutes les valeurs de l'expression données en fonction d'une population biaisée. Suppose que ses arguments représentent la population entière. Utilisez cette fonction pour les échantillons conséquents.1 valeur (0,5000)
Désagrégation

Renvoie tous les enregistrements présents dans les données de base. Pour désagréger toutes les mesures de la vue, sélectionnez Agrégation des mesures dans le menu Analyse (pour décocher la case).

Tableau vous permet d'afficher des données sous forme désagrégée (bases de données relationnelles uniquement). Lorsque les données sont désagrégées, vous pouvez afficher individuellement toutes les lignes de votre source de données. Par exemple, après avoir observé que la somme des ventes d'élastiques est de 14 600 dollars, vous pouvez analyser la répartition des transactions de ventes individuelles. Pour répondre à cette question, vous devez créer une vue qui affiche les lignes de données individuellement. Cela signifie qu'il est nécessaire de désagréger les données (consultez Comment désagréger les données). Pour consulter des données désagrégées, l'autre solution consiste à afficher les données de base pour tout ou partie d'une vue. Pour plus d'informations, consultez Afficher les données sous-jacentes.

4 valeurs (1, 2, 2, 3)

Vous pouvez également définir des agrégations personnalisées comme décrit dans Fonctions d'agrégation dans Tableau. En fonction du type de vue de données que vous créez, Tableau applique ces agrégations au niveau de détail approprié. Par exemple, Tableau appliquera l'agrégation individuellement aux membres d'une dimension (l'heure de livraison moyenne dans la région Est), à tous les membres d'une dimension donnée (heure de livraison moyenne dans les régions Est, Ouest et Centre), ou à des groupes de dimensions (la somme des ventes pour toutes les régions et tous les marchés).

Définir l'agrégation par défaut pour une mesure

Il est possible de définir l'agrégation par défaut pour toute mesure qui n'est pas un champ calculé contenant lui-même une agrégation, par exemple AVG([Discount]). Il est préférable d'utiliser une agrégation par défaut pour résumer un champ continu ou discret. L'agrégation par défaut est utilisée automatiquement lorsque vous faites glisser une mesure vers une vue.

Pour modifier l'agrégation par défaut :

Cliquez avec le bouton droit de la souris (contrôle-clic sur Mac) sur une mesure dans le volet Données et sélectionnez Propriétés par défaut > Agrégation, puis sélectionnez l'une des options d'agrégation.

Remarque : avec Tableau, seules les sources de données relationnelles permettent d'agréger des mesures. Les bases de données multidimensionnelles contiennent uniquement des données agrégées.

Vous ne pouvez pas définir des agrégations par défaut pour les sources de données publiées. L'agrégation par défaut est définie lorsque la source de données est publiée initialement. Créez une copie locale de la source de données publiée pour ajuster l'agrégation par défaut.

Comment désagréger les données

Dès que vous ajoutez une mesure à votre vue, une agrégation est appliquée à cette mesure par défaut. Cette mesure par défaut est contrôlée par le paramètre Agréger les mesures dans le menu Analyse.

Si vous décidez que vous souhaitez voir tous les repères de la vue au niveau de granularité le plus détaillé, vous pouvez désagréger la vue. La désagrégation de vos données signifie que Tableau affichera un repère séparé pour chaque valeur de données dans chaque ligne de votre source de données.

Pour désagréger toutes les mesures de la vue :

  • Désélectionnez l'option Analyse >Agréger les mesures. Si elle est déjà sélectionnée, cliquez une fois sur l'option Agréger les mesures pour la désélectionner.

Lorsque l'option Agréger les mesures est sélectionnée, Tableau tente de mettre à niveau les mesures dans la vue par défaut. Cela signifie qu'il collecte les valeurs des lignes individuelles depuis votre source de données en une seule valeur (qui devient un seul repère) adaptée au niveau de détail de votre vue.

Les différentes agrégations disponibles pour une mesure déterminent la manière dont les valeurs individuelles sont collectées : elles peuvent être faire l'objet d'une addition (SUM), d'une moyenne (AVG) ou d'une définition sur la valeur maximum (MAX) ou minimum (MIN) à partir des valeurs de lignes individuelles.

Pour une liste complète des agrégations disponibles, consultez Liste des agrégations prédéfinies dans Tableau .

Le niveau de détail est déterminé par les dimensions dans votre vue. Pour des informations sur le concept de niveau de détail, consultez Comment les dimensions affectent le niveau de détail dans la vue.

La désagrégation de vos données peut être utile lorsque vous analysez des mesures que vous voulez utiliser à la fois de façon dépendante et indépendante dans la vue. Par exemple, vous êtes en train d'analyser les résultats d'une enquête de satisfaction produit avec l'âge des participants le long d'un des axes. Vous pouvez agréger le champ Âge afin de déterminer l'âge moyen des participants, ou bien désagréger les données pour déterminer à quel âge les participants ont été le plus satisfaits du produit.

La désagrégation des données peut être utile lorsque vous affichez des données sous forme de nuage de points. Consultez Exemple : nuages de points, agrégation et granularité.

Remarque : Si votre source de données est très volumineuse, la désagrégation des données peut engendrer une diminution importante des performances.

 

Exemple : nuages de points, agrégation et granularité

Si vous placez une mesure sur l'étagère Lignes et une autre sur l'étagère Colonnes, vous demandez à Tableau de comparer deux valeurs numériques. Généralement, dans ce genre de situation, Tableau choisit un nuage de points en tant que visualisation par défaut. La vue initiale contiendra très probablement un seul repère, affichant la somme de toutes les valeurs pour les deux mesures. La raison est que vous devez augmenter le niveau de détail de la vue.

Commencer à créer le nuage de points

Plusieurs solutions sont possibles pour ajouter des informations à un nuage de points de base : vous pouvez utiliser des dimensions pour ajouter des informations, ajouter des mesures et/ou des dimensions supplémentaires aux étagères Lignes et Colonnes pour créer plusieurs nuages de points à un repère dans la vue, ou encore désagréger les données. Vous pouvez également associer ces options. Cette rubrique examine ces alternatives en utilisant la source de données Sample-Superstore.

Pour créer la vue initiale, procédez comme suit :

  1. Placez la mesure Sales sur l'étagère des colonnes.

  2. Placez la mesure Profit sur l'étagère des lignes.

Les mesures sont automatiquement agrégées en tant que sommes. L'agrégation par défaut (SUM) est indiquée dans les noms des champs. Les valeurs affichées dans les infobulles montrent la somme des valeurs des ventes et du bénéfice dans toutes les lignes de la source de données.

Suivez la procédure ci-dessous pour utiliser des dimensions afin d'ajouter des détails à la vue et de désagréger des données.

Utiliser des dimensions pour ajouter des détails

Pour développer la vue nuage de points créée ci-dessus, suivez cette procédure en ajoutant des dimensions pour afficher des niveaux de détail supplémentaires.

  1. Faites glisser la dimension Catégorie vers Couleur sur la fiche Repères.

    Cette méthode sépare les données en trois repères (un par membre de la dimension) et encode les repères à l'aide de couleurs.

  2. Faites glisser la dimension État vers Détail sur la fiche Repères.

    Les repères présents dans la vue sont désormais plus nombreux. Le nombre de repères est égal au nombre d'états distincts dans la source de données multiplié par le nombre de catégories.

Bien que plus de repères soient désormais affichés, les mesures sont toujours agrégées. Par conséquent, quel que soit le nombre de lignes dans la source de données présentant les informations État = Dakota du Nord et Catégorie = Mobilier, ou 100 lignes de ce type, le résultat est toujours un seul repère.

Il se peut que ce processus développe la vue d'une manière qui peut vous convenir. Si cela n'est pas le cas, il est possible d'ajouter une dimension temporelle à la vue ou d'introduire des courbes de tendance ou de la prévision. C'est vous qui décidez. Vous déterminez les questions à poser.

Essayer d'ajouter des champs aux étagères Lignes et Colonnes

Revenez à la vue d'origine à un repère et suivez cette procédure pour développer la vue du nuage de points en ajoutant des champs aux étagères Lignes et Colonnes.

  1. Faites glisser la dimension État vers l'étagère Colonnes.

    Même si vous déposez Continent à droite de SUM(Sales), Tableau le déplace à gauche de SUM(Sales). Cela est dû au fait qu'il est impossible d'insérer une dimension dans un axe continu. Au lieu de cela, vos vues affichent un axe distinct pour chaque membre de la dimension.

  2. Faites glisser la dimension Segment vers l'étagère Lignes.

    Vous disposez désormais d'une vue qui offre une vue d'ensemble des ventes et des bénéfices dans tous les États et les segments de clients. Il peut être intéressant de pointer la souris sur les repères dans la vue pour voir des données d'infobulles pour différents segments :

Essayer de désagréger les données

Une autre solution pour modifier le nuage de points ne comportant qu'un seul repère consiste à désagréger les données.

Désélectionnez l'option Analyse >Agréger les mesures. Si elle est déjà sélectionnée, cliquez une fois sur l'option Agréger les mesures pour la désélectionner.

Vous avez ainsi effectivement désagrégé les données, car cette commande est un basculement sélectionné à l'origine (coche présente). Par défaut, Tableau agrège des données dans votre vue.

De nombreux repères apparaissent désormais, un par ligne dans votre source de données d'origine :

Lorsque vous désagrégez des mesures, ce ne sont plus la moyenne ni la somme des valeurs qui apparaissent dans les lignes de la source de données. Au contraire, la vue affiche un repère pour chaque ligne de la source de données. La désagrégation des données est un moyen de consulter l'ensemble des données. Elle constitue une manière rapide de comprendre la forme de vos données et d'identifier les aberrations. Dans ce cas, les données désagrégées montrent qu'il existe une relation incohérente entre le chiffre d'affaires et le bénéfice lié aux ventes dans plusieurs lignes des données (la présence d'une ligne de repère inclinée de 45 ° l'indique).

 

 

 

Merci pour vos commentaires ! Il y a eu une erreur lors de l’envoi de vos commentaires. Essayez à nouveau ou envoyez-nous un message.