使用数据的提示

可按各种方式对数据进行组织。若要利用 Tableau Desktop,Tableau 建议您连接到针对分析设置格式的数据。具体而言,是指下面这样的数据:

  • 尽可能细化的数据,而不是聚合数据(例如每日天气数据,而不是月平均值)

  • 像数据库表一样组织的数据(而不是列式存储表,例如交叉表)

  • 已去除无关信息(不是数据及其标题的任何信息)的数据

构造用于分析的数据时,提出和回答问题会容易得多。Tableau 可以将原始数据聚合到所需级别,而不会被数据中已经存在的聚合所限制。可以根据需要创建组和分层结构,并可以在分析流程中执行计算。

Tableau Desktop 包含基本清理选项和 Data Interpreter。对于更复杂的格式设置问题,可能必须使用 Tableau Prep。

以下特定于 Tableau Desktop 的部分重点介绍并提供了一些建议,用于解决可能会导致难以进行数据分析的一些常见格式设置或问题。

以交叉表格式对数据进行透视

当数据格式采用交叉表格式时,表为列式存储表。在列式存储表中,变量存储为列标题。但是,Tableau Desktop 是针对行式存储数据进行优化的。在行式存储表中,变量存储在行值中。

例如,假设您有列式存储表,其中显示小学学生的数学、科学和历史分数。

Tableau Desktop 经过优化,可连接到行式存储表,其中数学、科学和历史值列在一个名为“科目”的列下,而每名学生的分数列在一个名为“分数”的列下。您可以通过手动编辑 Excel 数据来对行中的各列进行透视。或者,从 Desktop 中连接到 Excel 数据,然后使用行转置为列选项。有关转置选项的详细信息,请参见对数据进行转置(从列到行)

移除预先聚合的数据

数据通常已经过预先聚合。也就是说,数据可能包含总和、平均值、中值等。预先聚合数据示例的常见形式为小计和总计。小计和总计数据依据原始数据计算而得,但不属于原始数据本身。

例如,假设您有一个包含一行小计信息的表。

在这种情况下,需要移除预先聚合的数据。若要在分析中使用小计和总计,请从表中手动移除这种类型的信息。然后,从 Desktop 中连接到 Excel 数据,并使用合计选项计算小计和合计。有关详细信息,请参阅在可视化项中显示合计。或者,从 Desktop 中连接到 Excel 数据,打开 Data Interpreter,然后使用合计选项。有关详细信息,请参见使用 Data Interpreter 清理 Excel、CSV、PDF 和 Google Sheets 中的数据

移除或排除介绍性文本

以报表形式交付的 Excel 数据可能包含标题和介绍性文本块。因为 Desktop 需要表的第一行中包含列标题或行值,所以此信息可能会在分析期间导致问题。

例如,假设您有一个包含报表标题和日期的表。

在这种情况下,需要移除标题和日期信息。若要为报表使用标题和日期,请执行以下操作之一:

将分层标题展平为单一行

通常,Tableau Desktop 仅需要 Excel 数据中的第一行包含列标题。包含多层列标题的数据可能会在分析过程中导致问题。

例如,假设您有包含一个主标题和多个副标题的表。

在这种情况下,必须展平或移除标题分层结构。为此,您可以直接在 Excel 数据中为分层结构中的每个标题手动创建一个新列。或者,从 Tableau Desktop 中连接到 Excel 数据,然后打开 Data Interpreter。验证标题是否已正确展平。有关 Data Interpreter 的详细信息,请参见使用 Data Interpreter 清理 Excel、CSV、PDF 和 Google Sheets 中的数据

确保没有空白单元格

如果为分层标题创建新列,请确保新列中的每个单元格都包含值。

尽管您可能会为每一行重复相同的值,但重要的是每一行都要包含将其与分层标题中存储的数据关联的数据。您必须从 Excel 数据中手动移除空白单元格。

移除空白行

确保数据中没有空白行。若要修复空白行,您必须从 Excel 数据中移除空白行。

添加缺失的标题

确保没有缺失的列标题。若要修复缺失的标题,您必须手动将缺失的标题直接添加到 Excel 数据。

感谢您的反馈!您的反馈已成功提交。谢谢!