Examinar e filtrar dados

Tenha uma boa compreensão da composição dos dados para entender melhor as alterações necessárias e o efeito das operações incluídas no fluxo.

Ver detalhes de tamanho dos dados

Após conectar-se a seus dados, adicione uma tabela ao fluxo e depois adicione uma etapa. É possível usar o painel Perfil para ver o estado e a estrutura atuais dos seus dados e identificar nulos e exceções.

  • Número de campos e linhas: no canto superior direito do painel Perfil é possível encontrar informações que resumem o número de campos e linhas nos dados em determinado momento do fluxo. O Tableau Prep Builder arredonda para o milhar mais próximo. No exemplo abaixo há 21 campos e 3000 linhas no conjunto de dados.

    Ao passar o cursor pelo número de campos e linhas, é possível ver o número exato de linhas (neste exemplo, 2848):


  • Tamanho do conjunto de dados: trabalhe com um subconjunto de dados ao especificar o número de linhas a serem incluídas na guia Amostra de dados, no painel de Entrada.

  • Amostra: para habilitar a interação diretamente com os dados, o Tableau Prep Builder trabalha com um subconjunto dos seus dados brutos. O número de linhas é determinado pelos tipos de dados e número de campos que estão sendo renderizados. Campos de cadeia de caracteres ocupam mais espaço de armazenamento que inteiros. Dessa forma, se tiver 10 campos de cadeia de caracteres em seu conjunto de dados é possível que obtenha menos linhas do que se tivesse 10 campos de inteiros. Um indicador de Amostra é exibido próximo aos detalhes de tamanho no painel Perfil para indicar que se trata de um subconjunto do conjunto de dados. Para obter mais informações sobre amostras de dados, consulte "Definir o tamanho da amostra de dados" em Conectar a dados.

  • Número de valores exclusivos: o número próximo ao cabeçalho do campo representa os valores distintos contidos nesse campo. O Tableau Prep Builder arredonda para o milhar mais próximo. No exemplo abaixo, há 3.000 valores distintos representados no campo Descrição, mas se passar o cursor pelo número é possível ver o número exato de valores únicos.



Consultar os tipos de dados atribuídos aos seus dados

Como o Tableau Desktop, o Tableau Prep Builder interpreta os dados nos campos quando você arrasta uma conexão até o painel Fluxo e atribui automaticamente um tipo de dados a eles. Como banco de dados diferentes podem lidar com dados de maneiras diversas, a interpretação do Tableau Prep Builder pode nem sempre estar correta.

Para alterar um tipo de dados, clique no ícone de tipo de dados e selecione o tipo correto no menu de contexto. É possível alterar os tipos de dados de cadeia de caracteres ou de inteiros para Data ou Data e hora, e o Tableau Prep Builder acionará o DateParse automático para alterar esses tipos de dados. Como no Tableau Desktop, se as alterações não forem bem-sucedidas, você verá valores Nulos nos campos e será possível criar um cálculo para fazer a alteração.

Para obter mais informações sobre como usar o DataParse, consulte Converter um campo em um campo de data na Ajuda para criação na Web e do Tableau Desktop.

Atribuir funções de dados a seus dados

Para facilitar a identificação dos valores de campo que não são válidos, é possível atribuir uma função de dados ao campo da mesma maneira que um tipo de dados é atribuído. Isso diz ao Tableau Prep Builder o que os valores de dados representam para que ele possa validar automaticamente os valores e destacar aqueles que não sejam válidos para aquela função.

As funções de dados dizem para o Tableau Prep Builder o que os valores de campo significam ou representam. Por exemplo, se você tiver valores de campo para dados geográficos, é possível atribuir uma função de dados Cidade e o Tableau Prep Builder comparará os valores no campo com um conjunto de valores ou padrões de domínio conhecidos para identificar os valores sem correspondência.

Observação: cada campo é analisado de maneira independente para que um valor de Cidade como "Portland" no Estado de "Washington" no País "EUA" não possa ser uma combinação válida de cidade e estado, mas ele não será identificado dessa maneira porque é um nome de cidade válido.

O Tableau Prep Builder oferece suporte às seguintes funções de dados:

  • E-mail

  • URL

  • Funções geográficas (baseadas nos dados geográficos atuais e são os mesmos dados usados pelo Tableau Desktop)

    • Aeroporto
    • Código de área (EUA)
    • CBSA/MSA
    • Cidade
    • Distrito congressional (EUA)
    • País/região
    • Condado
    • NUTS Europeus
    • Estado/Província
    • CEP/Código postal

Dica: no Tableau Prep Builder versão 2019.1.4 e posteriores, se você atribuir uma função geográfica a um campo, também poderá usar essa função de dados para correspondência, além de agrupar valores com o valor padrão definido por ela. Para obter mais informações sobre o agrupamento de valores usando funções de dados, consulte Agrupar valores semelhantes por função de dados.

Para definir uma função de dados para o campo, realize as ações a seguir:

  1. No painel Perfil ou Resultados, ou na grade de dados, clique no tipo de dados do campo.

  2. Selecione a função de dados para o campo.

    O Tableau Prep Builder compara os valores de dados do campo com valores ou padrões de domínio conhecidos (para e-mail ou URL) para a função de dados selecionada e marca qualquer valor sem correspondência com um ponto de exclamação vermelho.

  3. Clique na seta suspensa do campo e na seção Mostrar valores selecione uma opção para mostrar todos os valores ou somente valores válidos ou não válidos para a função de dados.

  4. Use as opções de limpeza no menu Mais opções para corrigir qualquer valor inválido. Para obter mais informações sobre como limpar valores dos campos, consulte Aplicar operações de limpeza.

Ver a distribuição de valores ou valores exclusivos

Por padrão, o Tableau Prep Builder agrupa valores numéricos, de data e de data/hora de um campo em cestos. Esses cestos também são conhecidos como compartimentos. Os compartimentos garantem que veja a distribuição de valores como um todo e que identifique rapidamente as exceções e valores nulos. O tamanho do compartimento é calculado com base nos valores mínimo e máximo no campo, e os valores nulos sempre são mostrados na parte superior da distribuição.

Por exemplo, as datas do pedido e do envio são resumidas ou "compartimentadas” por ano. Cada compartimento representa um ano de janeiro do ano inicial a janeiro do ano seguinte, adequadamente rotulado. Como há datas de venda e de envio que caem na segunda metade de 2018 e 2019, um compartimento é criado para o ano seguinte que contém esses valores.

Se um campo de dados discreto (ou categórico) tiver muitas linhas ou uma distribuição tão grande que não possa ser exibida sem rolagem, é possível ver uma distribuição resumida à direita do campo. Você pode clicar e rolar por toda a distribuição para encontrar valores específicos.

Quando os dados tiverem campos numéricos ou de data, é possível alternar para exibir a versão detalhada (discreta) ou resumida (contínua) dos valores. A exibição resumida mostra o intervalo de valores em um campo e a frequência com que certos valores aparecem.

Essa alternância pode ajudar a isolar valores exclusivos (como o número de “3” registros em um campo) ou a distribuição de valores (como a soma de todos os “3” registros em um campo).

Para alternar a exibição:

  1. No painel Perfil ou Resultados, ou na grade de dados, clique no menu Mais opções de um campo numérico ou de data.

  2. No menu de contexto, selecione Detalhe para ver a versão detalhada dos valores ou Resumo para ver a versão distribuída.

Classificar valores e campos

As opções de classificação em um cartão de perfil permitem classificar os compartimentos (a contagem dos valores representados pelas barras de distribuição) em ordem crescente ou decrescente, ou classificar os valores de campo individuais em ordem alfabética.

Se desejar reorganizar a ordem dos campos, no painel Perfil ou Resultados, ou na grade de Dados, selecione um cartão de perfil ou um campo na grade de dados e arraste-o até que a linha de destino preta seja exibida. Em seguida solte-o no local adequado. O painel Perfil e a grade de dados são sincronizados para que o campo apareça na mesma ordem nos dois locais.

Realçar campos e valores em um fluxo

O Tableau Prep Builder facilita a localização de campos e valores nos dados do fluxo. Rastreie onde um campo foi originado e onde ele é usado em todo o fluxo, no painel Fluxo, ou clique em valores individuais em um cartão Perfil ou na grade de dados para realçar valores relacionados ou idênticos.

Rastrear campos em um fluxo

No Tableau Prep Builder versão 2018.3.3 e posteriores, é possível realçar todos os locais onde um campo é usado em um fluxo, até mesmo onde ele foi originado, de forma a ajudar a rastrear valores ausentes ou solucionar problemas em um fluxo quando não estiver recebendo os resultados esperados

Clique em um campo no painel Perfil em uma etapa de limpeza ou no painel Resultados em qualquer outra etapa e o painel Fluxo realçará o caminho onde o campo é usado.

Observação: essa opção não está disponível para tipos de etapa de Entrada ou Saída.

Ver valores relacionados

É possível usar o recurso de destaque para encontrar valores relacionados entre campos. Ao clicar em um valor no cartão Perfil, no painel Perfil ou Resultados, todos os valores relacionados nos outros campos serão destacados em azul. A cor azul mostra a distribuição de relações entre o valor selecionado e os valores em outros campos.

Por exemplo, para destacar valores relacionados, no painel Perfil, clique no valor de um campo. Os valores relacionados em outros campos ficam azul e a proporção da barra destacada em azul representa o grau de associação.

Destacar valores idênticos

Ao selecionar um valor na grade de dados, todos os valores idênticos também são destacados. Esses destaques ajudam a identificar padrões ou irregularidades nos dados.

Manter ou remover campos

À medida que você trabalha com seus dados no fluxo, talvez queira remover campos indesejados. No painel Perfil ou na grade de dados em qualquer etapa de limpeza ou ação, selecione um ou mais campos e clique com o botão direito do mouse (MacOS) e selecione Remover para remover os campos selecionados ou selecione Manter apenas (versão 2019.2.2 e posterior) para manter somente os campos selecionados e remover todos os campos não selecionados.

Campos duplicados (versão 2019.2.3 e posterior)

Se você quiser experimentar as operações de limpeza em um campo, mas não quiser alterar os dados originais, poderá duplicar os campos .

  1. No painel Perfil, na grade de dados ou no painel Resultados, selecione o campo que deseja duplicar.

  2. No menu Mais opções, selecione Campo duplicado.

Um novo campo é criado com o mesmo nome e um modificador. Por exemplo, "Data de envio -1".

Pesquisar por campos e valores

No painel Perfil ou Resultados, é possível pesquisar campos ou valores de seu interesse e usar os resultados da pesquisa para filtrar os dados.

Para pesquisar por campos, insira um termo de pesquisa completo ou parcial na caixa de pesquisa na barra de ferramentas.

Para pesquisar por um valor em um campo:

  1. Clique no ícone de pesquisa de um campo e insira um valor.

  2. Para usar opções de pesquisa avançada, clique no botão Opções de pesquisa....

  3. Para usar os resultados de pesquisa para filtrar os dados, selecione Manter apenas ou Excluir.

    No painel Fluxo, um ícone de filtro é exibido acima das etapas afetadas.

Filtrar valores

Uma maneira fácil de filtrar um valor é selecioná-lo em um cartão de perfil, na grade de dados ou no cartão Resultados, clicar com o botão direito do mouse e depois selecionar Manter apenas ou Excluir. Também é possível selecionar Editar valor para editar o valor em linha.

É possível filtrar dados em qualquer etapa do fluxo. Para adicionar um filtro, clique no menu Mais opções no cartão de perfil, na grade de dados ou no painel Resultados.

Observação: para aplicar um filtro na grade de dados do menu Mais opções, clique no botão Ocultar painel Perfil e depois clique em Mais opções no campo que deseja filtrar.

Filtros disponíveis para cada tipo de dados

Tipo de dados Filtros disponíveis
Cadeia de caracteres Cálculo, Correspondência curinga, Valores nulos, Valores selecionados
Número Cálculo, Intervalo de valores, Valores nulos, Valores selecionados
Data e Data e hora Cálculo, Intervalo de datas, Data relativa, Valores nulos, Valores selecionados

Usar um filtro de cálculo

Ao selecionar Cálculo, a caixa de diálogo Adicionar filtro é aberta. Insira o cálculo, verifique se é válido e clique em Salvar.

Usar um filtro Valores selecionados (versão 2019.2.3 e posterior)

Ao selecionar Valores selecionados, você pode escolher os valores que deseja manter ou excluir de um campo, mesmo valores que não estão em sua amostra. No painel direito, clique na guia Manter apenas ou Excluir para selecionar a ação e, em seguida, insira os termos de pesquisa para procurar valores ou clique em Adicionar um valor para adicionar valores que estão no seu conjunto de dados, mas não estão incluídos na amostra. Clique em Concluir para aplicar o filtro.

Observação: essas opções de filtro não estão disponíveis para os tipos de etapa Agregação ou Dinamização .

Usar um filtro de Intervalo de valores

Ao selecionar Intervalo de valores, é possível especificar um intervalo ou definir valor mínimo e máximo.

Usar filtro de intervalo de datas

Ao selecionar Intervalo de datas, é possível especificar um intervalo de datas ou definir uma data mínima e máxima.

Usar um filtro de data relativa

Ao selecionar Datas relativas, é possível filtrar o intervalo de datas com base no ano, trimestre, mês, semana ou dia. Além disso, é possível configurar uma referência relativa a uma data específica e incluir valores nulos.

Usar um filtro de correspondência curinga

Ao selecionar correspondência curinga, é possível filtrar os valores de campo para manter ou excluir apenas os valores que correspondam aos seus critérios. No editor de filtros, selecione a guia Manter apenas ou a Excluir, insira um valor a ser correspondido e depois defina os critérios para retornar os valores que está procurando.

Os resultados filtrados são exibidos no painel à esquerda do editor de filtros para que você possa revisar e experimentar com os resultados Assim que tiver os resultados desejados, clique em Concluído para aplicar a alteração.

Usar um filtro de valores nulos

Ao selecionar Valores nulos, é possível filtrar os valores no campo selecionado para mostrar apenas os valores nulos ou excluir todos os valores nulos.

Obrigado pelo feedback! Ocorreu um erro ao enviar seu feedback. Tente novamente ou envie-nos uma mensagem..