Limpar e formatar dados

Limpe e formate dados para facilitar a agrupá-los com outros dados ou para simplificar o entendimento de outras pessoas.

Criar seu fluxo

Após se conectar aos dados que deseja incluir no fluxo, comece a limpar e formatá-los ao adicionar novas etapas ao fluxo. Passe o cursor sobre uma etapa até que o ícone de adição apareça, em seguida clique nele para exibir as opções.

Use as opções a seguir para criar o fluxo:

  • Adicionar extensão: divida seu fluxo em diferentes extensões.

  • Adicionar etapa ou Inserir etapa: adicione uma etapa ao novo fluxo ou insira uma etapa em um fluxo existente para executar operações de limpeza.

  • Adicionar agregação: selecione a etapa que inclui os dados que deseja agregar ou agrupar.

  • Adicionar dinamização: selecione a etapa que inclui os dados que deseja dinamizar.

  • Adicionar união de colunas: selecione a etapa a qual deseja unir colunas de dados. No Tableau Prep Builder versão 2019.1.3 e posteriores, se você se conectar a bancos de dados que incluem tabelas com dados de relacionamento, também poderá criar uma união a partir do menu no painel Fluxo. Para obter mais informações sobre como unir tabelas utilizando esse método, consulte Unir colunas de dados na etapa de entrada.

    Como alternativa, é possível arrastar e soltar uma etapa para unir colunas de arquivos. No exemplo a seguir, a etapa de entrada Orders_Central é arrastada e solta em União de colunas:

    Para obter mais informações sobre a criação de uma união de colunas, consulte Unir colunas ou linhas de dados.

  • Adicionar união de linhas: selecione a etapa a qual deseja unir linhas de dados. Como alternativa, é possível arrastar e soltar uma etapa para unir linhas de arquivos. Para obter mais informações sobre a criação de uma união de linhas, consulte Unir colunas ou linhas de dados.

  • Adicionar saída: selecione essa opção para salvar a saída de um arquivo de extração (.tde ou .hyper), de um arquivo .csv ou para publicar a saída como uma fonte de dados em um servidor.

Alterar o esquema de cores

Por padrão, o Tableau Prep Builder atribui uma cor a cada etapa do fluxo. Esse esquema de cores é aplicado em todo o fluxo para ajudar a rastrear os dados conforme você aplica as etapas de limpeza, une colunas ou linhas ou agrega os dados para saber quais arquivos são afetados pelas operações.

Para selecionar um esquema de cores diferente para as etapas, faça o seguinte:

  1. Selecione uma ou mais etapas.

  2. Clique com o botão direito do mouse em uma etapa selecionada e selecione Editar cor da etapa.

  3. Clique em uma cor na paleta de cores para aplicá-la.

Para redefinir a cor da etapa novamente como a cor padrão, escolha uma das opções a seguir:

  • Clique em Desfazer no menu superior.

  • Ctrl+Z ou Command-Shift-Z (Mac).

  • Selecione as etapas alteradas, clique com o botão direito do mouse em uma etapa selecionada e selecione Editar cor da etapa, depois selecione Redefinir cor da etapa na parte inferior da paleta de cores.

Adicionar uma descrição

À medida que você cria o fluxo e realiza várias operações de limpeza, talvez queira adicionar uma descrição para ajudar outros usuários, que por sua vez podem visualizar ou trabalhar com ele posteriormente, a entender melhor suas etapas.

É possível adicionar uma descrição a qualquer etapa individual do fluxo diretamente no painel Fluxo. A descrição pode conter até 200 caracteres.

Ao adicionar uma descrição, um ícone de mensagem é adicionado embaixo da etapa. Clique no ícone para mostrar ou ocultar o texto da descrição no painel Fluxo.

Para adicionar uma descrição a uma etapa, faça o seguinte:

  1. No painel Fluxo, selecione uma etapa.

  2. Execute um destes procedimentos:

    • Clique com o botão direito do mouse na etapa e selecione Adicionar descrição no menu.

    • Clique duas vezes no campo de nome da etapa, depois clique em Adicionar uma descrição.

  3. Digite a descrição na caixa de texto.

  4. Clique fora da caixa de texto ou pressione Enter para aplicar as alterações. Como padrão, a descrição é exibida embaixo da etapa. Para ocultar a descrição, clique no ícone de mensagem .

  5. Para editar ou excluir a descrição, clique com o botão direito do mouse na etapa ou na descrição e selecione Editar descrição ou Excluir descrição no menu.

Reorganizar o layout do seu fluxo (versão 2019.2.2 e posterior)

Ao criar um fluxo, o Tableau Prep Builder adiciona suas etapas e ramificações usando um layout padrão. Cada fluxo processa os dados da esquerda para a direita, com as etapas de entrada começando na extremidade esquerda da tela e as etapas de saída terminando no lado direito da tela. No entanto, se você criar fluxos grandes e complexos, eles poderão se tornar difíceis de seguir.

Para limpar o layout do fluxo, você pode selecionar e mover etapas para que o layout do fluxo seja organizado de forma que faça sentido para você. Por exemplo, você pode corrigir linhas de fluxo cruzadas, movimentar as etapas do fluxo para limpar espaço em branco extra ou reorganizar as etapas do fluxo para mostrar uma sequência clara de eventos.

Por exemplo, o fluxo a seguir é confuso e difícil de seguir:

Para limpar esse fluxo, você pode selecionar e arrastar etapas para cima, para baixo, para a esquerda ou para a direita e soltá-las em um novo local na tela. As etapas de fluxo não podem ser movidas para uma posição que interrompa o fluxo do processo da direita para a esquerda. Por exemplo, você não pode arrastar uma etapa de união que esteja posicionada antes de uma etapa de junção para uma posição posterior à etapa de junção no fluxo.

Ao arrastar as etapas do fluxo para um local permitido, é exibida uma caixa laranja. Se o local não for permitido, nenhuma caixa laranja será exibida e as etapas retornarão ao local original quando você tentar soltá-las.

Assista a "Reorganizar etapas de fluxo" em ação

O exemplo a seguir mostra a reorganização de um fluxo usando arrastar e soltar.

Para mover as etapas do fluxo, faça o seguinte:

  1. No painel Fluxo, selecione as etapas que você quer mover. Clique em uma etapa específica, arraste para selecionar várias etapas ou clique com a tecla Ctrl pressionada ou aplique Cmd+Clique (MacOS) para selecionar etapas que não estejam próximas umas das outras.

  2. Arraste e solte as etapas para o novo local.

    Observação: se você não gostar da reorganização, poderá clicar em Desfazer no menu superior para reverter. No entanto, se você executar ações de limpeza entre o movimento das etapas, também poderá desfazer essas ações. A opção Desfazer reverte suas ações na ordem em que você as executou.

Remover etapas do fluxo

A qualquer momento no fluxo, é possível remover etapas ou as linhas de fluxo entre etapas.

  • Para remover uma etapa ou linha de fluxo, selecione a etapa ou linha que deseja remover, clique com o botão direito do mouse no elemento e selecione Remover.

  • Para remover várias etapas ou linhas de fluxo, execute uma das ações a seguir:

    • Use o mouse para arrastar e selecionar uma seção inteira do fluxo. Em seguida, clique com o botão direito do mouse em uma das etapas selecionadas e selecione Remover

    • Pressione Ctrl+A ou Cmd+A (MacOS) para selecionar todos os elementos do fluxo ou pressione Ctrl+clique ou Cmd+Click (MacOs) para selecionar elementos específicos; em seguida pressione a tecla Excluir.

Dinamizar os dados

Às vezes, a análise de dados em uma planilha ou no formato de tabela de referência cruzada pode ser difícil no Tableau. O Tableau prefere que os dados sejam "compridos" em vez de "largos", o que significa que, com frequência, é necessário dinamizar os dados de colunas para linhas para que o Tableau possa avaliá-los adequadamente.

No entanto, você também pode ter cenários em que as tabelas de dados são verticais e estreitas, além de muito normalizadas para serem analisadas adequadamente. Por exemplo, um departamento de vendas que acompanha o gasto com publicidade em duas colunas, uma chamada Publicidade, que contém linhas para rádio, televisão e impressão e outra para o gasto total. Nesse tipo de cenário, para analisar esses dados como medidas separadas, seria necessário dinamizá-los de linha para colunas.

Mas, como dinamizar conjuntos de dados maiores ou dados que mudam com frequência ao longo do tempo? Você pode usar uma correspondência de padrão curinga para pesquisar campos que correspondam ao padrão e dinamizar automaticamente os dados.

Use uma das seguintes opções ao dinamizar os dados:

  • Dinamizar colunas para linhas

  • Use a pesquisa curinga para dinamizar instantaneamente os campos com base em uma correspondência de padrão (Tableau Prep Builder versão 2019.1.1 e posteriores).

  • Dinamize colunas para linhas (Tableau Prep Builder versão 2019.1.1 e posteriores).

Independentemente de como os campos são dinamizados, é possível interagir diretamente com os resultados e executar quaisquer operações de limpeza adicionais para que seus dados tenham a aparência que você deseja. Além disso, é possível usar o recurso de nomeação inteligente padrão do Tableau Prep Builder para renomear automaticamente os campos e valores dinamizados.

Observação: não há suporte para dinamização de colunas para linhas em vários grupos de campos no Tableau Prep Builder 2018.1.1. A edição de uma dinamização que inclui colunas dinamizadas de vários grupos de campos no Tableau Prep Builder versão 2018.1.1 pode ocasionar erros ou resultados inesperados.

Dinamizar colunas para linhas:

Use essa opção de dinamizar para alterar de dados horizontais para dados verticais. Dinamize de colunas para linhas em um ou mais grupos de campos. Selecione os campos com os quais deseja trabalhar e dinamize os dados de colunas para linhas.

  1. Conecte-se à fonte de dados.

  2. Arraste a tabela que deseja dinamizar até o painel Fluxo.

  3. Clique no ícone de adição e selecione Adicionar dinamização no menu de contexto.

  4. (Opcional) No painel Campos, insira um valor no campo Pesquisar para pesquisar a lista de campos a serem dinamizados.

  5. (Opcional) Selecione Renomear automaticamente campos e valores dinamizados para permitir que o Tableau Prep renomeie os novos campos dinamizados usando valores comuns nos dados. Caso nenhum valor comum seja encontrado, o nome padrão é usado.
  6. Selecione um ou mais campos no painel à esquerda e arraste-os até a coluna Valores da Dinamização1 no painel Campos dinamizados.

  7. (Opcional) No painel Campos dinamizados, clique no ícone de adição para adicionar mais colunas para dinamizar, em seguida, repita a etapa anterior para selecionar mais campos a serem dinamizados. Seus resultados aparecem imediatamente tanto no painel Dinamizar resultados quanto na grade de dados.

    Observação: é necessário selecionar o mesmo número de campos selecionados na Etapa 5. Por exemplo, se tiver selecionado 3 campos para iniciar a dinamização, cada coluna dinamizada subsequente também deve conter 3 campos.

  8. Caso não tenha habilitado a opção de nomeação padrão ou se o Tableau Prep não detectou automaticamente um nome, edite os nomes dos campos. Também é possível editar os nomes dos campos originais neste painel para descrever os dados adequadamente.

  9. (Opcional) Renomeie a nova etapa Dinamizar para monitorar suas alterações. Por exemplo "Dinamizar meses".

  10. Para atualizar os dados dinâmicos quando os dados forem alterados, execute o fluxo. Caso sejam incluídos novos campos na fonte de dados que precisa ser adicionada à dinamização, adicione-os manualmente à dinamização.

Exemplo: dinamização em vários campos

Este exemplo mostra uma planilha de vendas, taxas e totais farmacêuticos por mês e ano.

Ao dinamizar os dados, é possível criar linhas para cada mês e ano e colunas individuais para vendas, taxas e totais, de forma que o Tableau possa interpretar esses dados com mais facilidade para a análise.

Veja a opção “Dinamizar em vários campos” em ação.

Usar a pesquisa curinga para dinamizar

No Tableau Prep Builder versão 2019.1.1 e posteriores, se você trabalhar com conjuntos de dados maiores ou os dados mudarem com frequência ao longo do tempo, use uma pesquisa curinga ao dinamizar colunas para linhas, assim os dados serão dinamizados instantaneamente com base em uma correspondência de padrão curinga. Caso sejam adicionados ou removidos novos campos que correspondam ao padrão, o Tableau Prep Builder detectará a alteração do esquema quando o fluxo for executado e os resultados da dinamização serão atualizados automaticamente.

  1. Conecte-se à fonte de dados.

  2. Arraste a tabela que deseja dinamizar até o painel Fluxo.

  3. Clique no ícone de adição e selecione Adicionar dinamização no menu de contexto.

  4. No painel Campos dinamizados, clique no link Clique aqui para criar uma dinamização curinga.

  5. Insira um valor ou valor parcial que deseja pesquisar. Por exemplo, insira Vendas_ para corresponder aos campos rotulados como vendas_2017, vendas_2018 e vendas_2019.

    Não use asteriscos para corresponder ao padrão, a menos que eles façam parte do valor do campo pesquisado. Em vez disso, clique no botão Opções de pesquisa para selecionar como deseja corresponder ao valor. Em seguida, pressione Enter para aplicar a pesquisa e dinamizar os valores correspondentes.

  6. (Opcional) No painel Campos dinamizados, clique no ícone de adição para adicionar mais colunas para dinamizar, em seguida, repita a etapa anterior para selecionar mais campos a serem dinamizados.

  7. Caso não tenha habilitado a opção de nomeação padrão ou se o Tableau Prep Builder não detectou automaticamente um nome, edite os nomes dos campos.

  8. Para atualizar os dados dinâmicos quando os dados forem alterados, execute o fluxo. Quaisquer novos campos adicionados à fonte de dados que correspondam ao padrão curinga são detectados e adicionados automaticamente à dinamização.

  9. Se os resultados não forem os esperados, tente uma das seguintes opções:

    • Insira um padrão de valor diferente no campo Pesquisar e pressione Enter. A dinamização será atualizada automaticamente e mostrará os novos resultados.

    • Arraste manualmente os campos adicionais para a coluna Valores de dinamização 1 no painel Campos dinamizados. Você também pode remover os campos que foram adicionados manualmente, arrastando-os da coluna Valores de dinamização 1 e soltando-os no painel Campos.

      Observação: os campos que foram adicionados dos resultados da pesquisa curinga não poderão ser removidos ao arrastá-los para fora da coluna Valores de dinamização 1. Em vez disso, tente usar um padrão mais específico para corresponder aos resultados da pesquisa desejados.

Dinamizar linhas para colunas

No Tableau Prep Builder versão 2019.1.1, é possível dinamizar linhas para colunas. Use essa opção caso os dados sejam muito normalizados e você precise criar novas colunas, de dados verticais para mais horizontais.

Por exemplo, se você tiver custos de publicidade referentes a cada mês que incluam todos os tipos de publicidade em uma coluna, ao dinamizar os dados de linhas para colunas, será possível ter uma coluna separada para cada tipo de publicidade, facilitando a análise dos dados.

Você pode selecionar um campo para a dinamização. Os valores desse campo são usados para criar as novas colunas. Em seguida, selecione um campo para ser usado para preencher as novas colunas. Esses valores de campo são agregados e é possível selecionar o tipo de agregação a ser aplicado.

Como a agregação foi aplicada, a dinamização inversa de colunas para linhas não reverterá essa ação de dinamização. Para inverter um tipo de dinamização de linha para coluna, você precisará desfazer a ação. Clique no botão Desfazer no menu superior, remova os campos do painel Campos dinamizados ou exclua a etapa de dinamização.

  1. Conecte-se à fonte de dados.

  2. Arraste a tabela que deseja dinamizar até o painel Fluxo.

  3. Clique no ícone de adição e selecione Adicionar dinamização no menu de contexto.

  4. No painel Campos dinamizados, selecione Linhas para colunas na lista suspensa.

  5. (Opcional) No painel Campos, insira um valor no campo Pesquisar para pesquisar a lista de campos a serem dinamizados.
  6. Selecione um campo no painel esquerdo e arraste-o para a seção Campo para dinamizar linhas para colunas no painel Campos dinamizados.

    Observação: se o campo no qual deseja dinamizar tiver um tipo de dados de data ou de data e hora, será necessário alterar o tipo de dados para cadeia de caracteres para dinamizá-lo.

    Os valores nesse campo serão usados para criar e nomear as novas colunas. Você pode alterar os nomes das colunas no painel Dinamizar resultados posteriormente.

  7. Selecione um campo no painel esquerdo e arraste-o para a seção Campo a ser agregado para as novas colunas no painel Campos dinamizados. Os valores nesse campo são usados para preencher as novas colunas criadas na etapa anterior.

    Um tipo de agregação padrão é atribuído ao campo. Clique no tipo de agregação para alterá-lo.

  8. No painel Dinamizar resultados, revise os resultados e aplique as operações de limpeza às novas colunas criadas.

  9. Se o campo que está sendo dinamizado tiver uma alteração nos dados da linha, clique com o botão direito do mouse, ou mantenha a tecla Command pressionada (Mac) e clique, na etapa de Dinamização do painel Fluxo e selecione Atualizar.

Aplicar operações de limpeza

Você limpa seus dados ao aplicar operações de limpeza como filtragem, adição, renomeação, divisão, agrupamento ou remoção de campos. Em versões anteriores, as operações de limpeza só podiam ser executadas no tipo Etapa de limpeza. No Tableau Prep Builder versão 2018.2.1 e posteriores, também é possível executar operações de limpeza na grade de dados em uma etapa de limpeza.

No Tableau Prep Builder versão 2018.3.1 e posteriores, é possível executar operações de limpeza na maioria das etapas do fluxo. A única exceção é a etapa de saída.

A tabela a seguir mostra quais operações de limpeza estão disponíveis em cada tipo de etapa:

  Entrada Limpeza Agregação Tabela dinâmica União de colunas União de linhas Saída
Filtrar X X X X X X  
Agrupar e substituir   X   X X X  
Limpar   X   X X X  
Dividir valores   X   X X X  
Renomear campo X X X X X X  
Duplicar Campo   X   X X X  
Manter apenas o campo X X X X X X  
Criar campo calculado   X   X X X  
Remover campo X X X X X X  
Editar valor   X   X X X  
Alterar tipo de dados X X X X X X  

Conforme faz alterações nos dados, anotações são adicionadas à etapa correspondente no painel Fluxo e uma entrada é adicionada ao painel Alterações para monitorar suas ações. Se fizer alterações na etapa de entrada, a anotação será mostrada à esquerda da etapa, no painel Fluxo, e ainda será mostrada no Perfil de entrada, na lista de campos.

A ordem em que você aplica mudanças é significativa. As alterações feitas a Agregar, Tabelas dinâmicas, União de colunas e União de linhas são executadas antes ou depois dessas ações de reformulação, dependendo de onde está o campo ao fazer a alteração. O local onde a alteração foi feita é mostrado no painel Alterações da etapa.

Por exemplo, se você alterar um valor de campo em uma cláusula de união de colunas, a alteração será executada antes da ação de união para fornecer os resultados corretos.

A tabela a seguir mostra onde a ação de limpeza é executada nos tipos de etapa Agregar, Dinamizar, União de colunas e União de linhas, dependendo de onde o campo está na etapa.

Ação   Agregação Agregação Tabela dinâmica Tabela dinâmica União de colunas União de colunas União de linhas União de linhas
  Localização do campo: Campos agrupados Campos agregados Não está na tabela de dinâmica Criado a partir da tabela dinâmica Incluído em uma tabela* Incluído nas duas tabelas* Campos incompatíveis Campos combinados
Filtrar   Antes da agregação Após a agregação Antes da dinamização Após a dinamização Antes da união de colunas Após a união de colunas Antes da união de linhas Após a união de linhas
Agrupar e substituir   NA NA Antes da dinamização Após a dinamização Antes da união de colunas Após a união de colunas Antes da união de linhas Após a união de linhas
Limpar   NA NA Antes da dinamização Após a dinamização Antes da união de colunas Após a união de colunas Antes da união de linhas Após a união de linhas
Dividir valores   NA NA Antes da dinamização Após a dinamização Antes da união de colunas Após a união de colunas Antes da união de linhas Após a união de linhas
Renomear campo   Antes da agregação Após a agregação Antes da dinamização Após a dinamização Antes da união de colunas Após a união de colunas Antes da união de linhas Após a união de linhas
Duplicar Campo   NA NA Antes da dinamização Após a dinamização Antes da união de colunas Após a união de colunas Antes da união de linhas Após a união de linhas
Manter apenas o campo   Após a agregação Após a agregação Antes da dinamização Após a dinamização Antes da união de colunas Após a união de colunas Antes da união de linhas Após a união de linhas
Remover campo   Remove da agregação Remove da agregação Antes da dinamização Após a dinamização Antes da união de colunas Após a união de colunas Antes da união de linhas Após a união de linhas
Criar campo calculado   NA NA Antes da dinamização Após a dinamização Antes da união de colunas Após a união de colunas Antes da união de linhas Após a união de linhas
Editar valor   NA NA Antes da dinamização Após a dinamização Antes da união de colunas Após a união de colunas Antes da união de linhas Após a união de linhas
Alterar tipo de dados   Antes da agregação Após a agregação Antes da dinamização Após a dinamização Antes da união de colunas Antes da união de colunas Antes da união de linhas Após a união de linhas

Observação: para união de colunas, se o campo for um campo calculado criado usando um campo de uma tabela, a alteração será aplicada antes da união de colunas. Se o campo for criados com campos de ambas as tabelas, a alteração será aplicada depois da união.

Aplicar operações de limpeza na etapa de entrada

Apenas algumas operações de limpeza estão disponíveis em uma etapa de entrada. Qualquer uma das alterações a seguir é permitida na lista Campo de entrada. Suas alterações são monitoradas no painel Alterações e as anotações são adicionadas à etapa de entrada no painel Fluxo e na lista Campo de entrada.

  • Filtrar: clique em Filtrar valores na barra de ferramentas e insira seu critério de filtragem no editor de cálculo.

  • Renomear campo: no campo Nome de campo, clique duas vezes (CTRL+clique no Mac) no nome de campo e insira um novo nome de campo.

  • Alterar tipo de dados: clique no tipo de dados do campo e selecione um novo tipo de dados no menu.

  • Remover campo: desmarque a caixa de seleção ao lado dos campos que não deseja incluir no fluxo.

Aplicar operações de limpeza em outras etapas

Todas as operações de limpeza estão disponíveis nos outros tipos de etapa. Para aplicar operações de limpeza a campos, use as opções da barra de ferramentas ou clique em Mais opções no cartão Perfil do campo para abrir o menu. Nos tipos de etapas Agregar, Dinamizar, Unir colunas e Unir linhas, o menu Mais opções está disponível nos cartões de perfil do painel Resultados.

Barra de ferramentas do painel Perfil Menu suspenso

Além disso, é possível aplicar operações de limpeza na grade de dados na etapa de limpeza. Basta clicar no botão Ocultar painel Perfil para recolher o painel Perfil e, em seguida, clicar em Mais opções em um campo para abrir o menu.

Observação: nem todas as operações de limpeza estão disponíveis na grade de dados. Por exemplo, caso deseje editar um valor em linha, você deve fazer isso no painel Perfil.

Para aplicar operações de limpeza a um campo:

  1. No painel Perfil ou Resultados, ou na grade de dados, selecione o campo que deseja alterar.

  2. Na barra de ferramentas ou em Mais opções do campo, selecione das opções a seguir:

    • Filtrar ou Filtrar Valores: selecione uma das opções de filtro, clique com o botão direito do mouse (CTRL + Clique no Mac) em um valor de campo para manter ou excluir valores ou use o filtro Valores selecionados para selecionar e escolher os valores para filtrar valores incluídos que não estão no seu exemplo de fluxo.

    • Agrupar e substituir: selecione manualmente os valores ou use o agrupamento automático. Além disso, possível selecionar vários valores no cartão Perfil e clicar com o botão direito do mouse (CTRL + clique) para agrupar ou desagrupar valores ou editar o valor do grupo.

    • Limpar: selecione de uma lista de operações rápidas de limpeza para aplicar a todos os valores no campo.

    • Dividir valores: selecione divisões automáticas ou personalizadas.

      Observação: divisões automáticas e personalizadas funcionam da mesma maneira que no Tableau Desktop. Para obter mais informações, consulte Dividir um campo em vários campos na Ajuda para criação na Web e do Tableau Desktop.

    • Renomear campo

    • Campo Duplicado (versão 2019.2.3 e posterior) Crie uma cópia do campo e dos valores.

    • Manter apenas o campo(versão 2019.2.2 e posterior)

    • Criar campo calculado

    • Remover campo

  3. Para editar um valor, clique com o botão direito do mouse ou em Ctrl+clique (MacOS) em um ou mais valores, selecione Editar valor e insira um novo valor. Além disso, é possível selecionar Substituir com nulo para substituir os valores com um valor nulo ou clicar duas vezes em um único valor para editá-lo diretamente. Para obter mais informações sobre edição de valores de campo consulte Limpar (corrigir) variações do mesmo valor.

  4. Consulte os resultados dessas operações no painel Perfil, painéis Resumo ou na grade de dados.

Visualizar suas alterações

Os diferentes tipos de operações de limpeza são representados por ícones nas etapas do fluxo. Caso mais de quatro tipos de operações sejam aplicados a uma etapa, uma elipse será exibida na etapa. Passe o cursor sobre esses ícones para exibir as anotações que mostram as operações aplicadas e a ordem na qual são executadas.

A partir do Tableau Prep Builder versão 2019.1.3 e posteriores, você pode clicar em uma anotação no ícone de alteração em uma etapa no painel Fluxo ou em um cartão de perfil no painel Perfil ou Resultados, e a alteração e o campo afetados serão realçados no painel Alterações e no painel Perfil ou Resultados.

Além disso, é possível selecionar uma etapa e expandir o painel Alterações para exibir os detalhes de cada alteração, editar ou removê-las, ou arrastá-las para cima e para baixo para trocar a ordem em que serão aplicadas. No Tableau Prep Builder versão 2019.1.1, você pode adicionar uma descrição para fornecer contexto para outros usuários.

Anotação de limpeza Painel Alterações

Ao visualizar alterações em uma etapa Agregar, Dinamizar, União de colunas ou União de linhas, a ordem em que a alteração é aplicada é mostrada antes ou depois da ação de reformulação. A ordem dessas alterações é aplicada pelo sistema e não pode ser alterada. É possível editar e remover a alteração.

Adicionar uma descrição para uma entrada de alteração (versão 2019.1.1 e posterior)

Adicione uma descrição de até 200 caracteres a qualquer entrada de alteração no painel Alterações para fornecer contexto adicional às suas alterações.

  1. No painel Fluxo, selecione uma etapa.

  2. Abra o painel Alterações ou a guia Alterações.

  3. Clique com o botão direito do mouse ou Ctrl+clique (Mac) em uma entrada no painel Alterações e selecione Adicionar descrição.

  4. Insira uma descrição para a etapa.

    A descrição é exibida abaixo do texto gerado para a alteração com um ícone de comentário .

  5. Para editar ou excluir a descrição, clique com o botão direito do mouse ou CTRL+Clique (Mac) no item de alteração e selecione Editar descrição ou Excluir descrição.

Aplicar operações de limpeza usando recomendações

Às vezes, pode ser difícil identificar qual operação de limpeza será necessária para corrigir problemas nos dados. O Tableau Prep Builder versão 2018.3.2 e posteriores tem a capacidade de analisar os dados e recomendar operações de limpeza que podem ser aplicadas automaticamente para ajudá-lo a corrigir com rapidez os problemas nos campos de dados ou a identificar problemas para poder corrigi-los.

Observação: se não quiser usar esse recurso, é possível desativá-lo. No menu superior, acesse Ajuda > Configurações e desempenho. Em seguida, clique em Habilitar recomendações para desmarcar a caixa de seleção ao lado da configuração.

Esse recurso está disponível em todos os tipos de etapas, exceto em Entrada, Saída e Unir colunas. Atualmente, os tipos de recomendação incluem:

  • Funções de dados

  • Agrupar e substituir (também se aplica a campos com funções de dados começando na versão 2019.2.3)
  • Filtrar

  • Substituir valores por valores nulos

  • Remover campos

  • Split (versão 2019.1.1 e posterior)

    Observação: essa opção funciona especificamente com dados em arquivos de texto de largura fixa. Para usar a recomendação de divisão com esse tipo de arquivo, após conectar-se à fonte de dados, na etapa de entrada, na guia Configurações de texto, selecione um caractere de Separador de campo que não esteja sendo usado nos dados, para que eles sejam carregados como um campo único.

  • Cortar espaços

Para usar recomendações para limpar os dados, faça o seguinte:

  1. Execute um destes procedimentos:

    • Clique no ícone de lâmpada no canto superior direito do cartão Perfil.
    • Na barra de ferramentas, clique na seta suspensa Recomendações para exibir todas as recomendações referentes a seu conjunto de dados e selecione uma recomendação na lista.

    Essa opção é exibida somente quando as alterações recomendadas são identificadas pelo Tableau Prep Builder.

  2. Para aplicar a recomendação, passe o mouse sobre o cartão Recomendações e clique em Aplicar.

    A alteração é aplicada automaticamente e uma entrada é adicionada ao painel Alterações. Para remover uma Alteração, clique em Desfazer no menu superior ou passe o mouse sobre a alteração no painel Alterações e clique no X para removê-la.

  3. Se o Tableau Prep Builder identificar recomendações adicionais como resultado da alteração, o ícone de lâmpada permanecerá no cartão Perfil até que nenhuma recomendação adicional seja encontrada.

    Repita as etapas acima para aplicar quaisquer alterações adicionais ou ignorar a alteração sugerida e usar as outras ferramentas de limpeza no Tableau Prep Builder para solucionar os problemas de dados.

Mesclar campos

Se você tiver campos que contêm os mesmos valores nomeados de forma diferente, é possível mesclá-los em um campo para agrupá-los, arrastando um campo até o outro. Ao mesclar os campos, o campo de destino se torna o campo primário e o nome do campo de destino permanece o mesmo. O campo mesclado ao campo de destino é removido.

Exemplo:

Uma união de linhas curinga resulta em 3 campos com os mesmos valores Mesclar 3 filtros em 1

Ao mesclar os campos, o Tableau Prep Builder mantém todos os campos do campo de destino e substitui todos os nulos dele por valores de campos de origem mesclados com o campo de destino. Os campos de origem são removidos.

Exemplo

Nome Contact_Phone Business_Phone Cell_Phone Home_Phone
Bob 123-4567 123-4567 nulo nulo
Sally nulo nulo 456-7890 789-0123
Fred nulo nulo nulo 567-8901
Emma nulo 234-5678 345-6789 nulo

Se você mesclar os campos Business _Phone, Cell_Phone e Home_Phone com o campo Contact_phone, os outros campos serão removidos e resultarão no seguinte:

Nome Contact_Phone
Bob 123-4567
Sally 456-7890
Fred 567-8901
Emma 234-5678

Para mesclar campos, execute uma das ações a seguir:

  • Arraste e solte um campo no outro. Um indicador Soltar para mesclar campos é exibido.

  • Selecione vários arquivos e clique com o botão direito do mouse na seleção para abrir o menu de contexto, em seguida clique em Mesclar campos.

  • Selecione vários campos e clique em Mesclar campos na barra de ferramentas.

Para obter informações sobre como corrigir campos sem correspondência devido a uma união de linhas, consulte Corrigir campos sem correspondência.

Limpar (corrigir) variações do mesmo valor

Diversas variações do mesmo valor podem impedir um resumo preciso dos dados. É possível corrigir essas variações de forma rápida e fácil usando as opções a seguir no Tableau Prep Builder.

Observação: qualquer edição feita no valores devem ser compatíveis com o tipo de dados do campo.

Editar valor único

  1. No cartão Perfil, clique no valor que deseja editar e insira o novo valor. Um ícone de agrupamento aparece próximo ao valor.

    Como alternativa, clique com o botão direito do mouse e, em seguida, clique em Editar valor. A alteração é gravada no painel Alterações, no lado esquerdo da tela.

  2. Consulte os resultados no painel Perfil e na grade de dados.

Editar vários valores

Há várias opções para a edição de vários valores de uma só vez. Por exemplo, use operações rápidas de limpeza para remover a pontuação em todos os valores de um campo, agrupe valores manualmente ao usar a seleção múltipla, agrupe valores automaticamente ao usar algoritmos de correspondência nebulosa que encontram valores similares ou selecione vários valores e os substitua por Nulo.

Observação: ao mapear vários valores em um só, o campo original mostra um ícone de agrupamento próximo ao valor, que mostra quais valores estão agrupados.

Editar vários valores usando operações rápidas de limpeza

Esta opção se aplica apenas a campos de texto.

  1. No painel Perfil ou Resultados, ou na grade de dados, selecione o campo que deseja editar.

  2. Clique em Mais opções, selecione Limpar, em seguida selecione uma das opções a seguir:

    • Tornar letras maiúsculas: altera todos os valores de texto em letras maiúsculas.

    • Tornar letras minúsculas: altera todos os valores de texto em letras minúsculas.

    • Remover letras: remove todas as letras e deixe apenas outros caracteres.

    • Remover números: remove todos os números e deixa apenas letras e outros caracteres.

    • Remover pontuação: remove toda a pontuação.

    • Cortar espaços: remove espaços à esquerda e à direita.

    É possível empilhar operações para aplicar várias operações de limpeza nos campos. Por exemplo, primeiro selecione Limpar > Remover números, em seguida selecione Limpar > Remover pontuação para remover todos os números e pontuação dos valores de campo.

  3. Para desfazer as alterações, clique na seta Desfazer, na parte superior do painel Fluxo, ou remova a alteração da lista de alterações.

Agrupar e editar vários valores embutidos

  1. No cartão Perfil, selecione o campo que deseja editar.

  2. Pressione a tecla Ctrl ou Shift+clique, ou Command ou Shift+clique (MacOS), e selecione os valores que deseja agrupar.

  3. Clique com o botão direito do mouse e selecione Agrupar no menu de contexto. O valor da seleção clicada com o botão direito do mouse se torna o nome padrão do novo grupo, mas é possível editar isso em linha.

  4. Para editar o nome do grupo, selecione o campo agrupado e edite o valor, ou clique com o botão direito do mouse ou pressione Ctrl + clique (no Mac) no campo agrupado e selecione Editar valor no menu de contexto.

  5. Para desagrupar os valores do campo agrupado, clique com o botão direito do mouse no campo agrupado e selecione Desagrupar no menu de contexto.

Substituir um ou mais valores com Nulo

Caso deseje incluir linhas de dados em sua análise, mas queira excluir determinados valores de campo, basta alterá-los para um valor nulo.

  1. No cartão Perfil, pressione a tecla Ctrl ou Shift+clique, ou Command ou Shift+clique (Mac), e selecione os valores que deseja alterar

  2. Clique com o botão direito do mouse ou Ctrl+clique (no Mac) e selecione Substituir com nulo no menu. Os valores são alterados para nulo e o ícone de grupo é mostrado ao lado do valor.

Editar vários valores manualmente usando o editor Agrupar e substituir

Use Agrupar e substituir para mapear valores de um campo entre si ou selecionar manualmente vários valores para agrupá-los. Além disso, é possível adicionar novos valores para definir relações de mapeamento para organizar os dados.

Por exemplo, digamos que você tenha três valores em um campo: Minha Empresa, Minha Empresa Incorporada e Minha Empresa Inc. Todos esses valores representam a mesma empresa, Minha Empresa. É possível usar o editor Agrupar e substituir para mapear os valores Minha Empresa Incorporada e Minha Empresa Inc para Minha Empresa, de forma que os três valores apareçam como Minha Empresa no campo.

Mapear vários valores para um único campo selecionado

  1. No painel Perfil ou Resultados, selecione o campo que deseja editar.

  2. Clique em Mais opções e selecione Agrupar e substituir > Seleção manual no menu de contexto.

  3. No painel à esquerda do editor Agrupar e substituir, selecione o valor de campo que deseja usar como o valor de agrupamento. Esse valor agora é exibido na parte superior do painel à direita.

  4. Na seção inferior do painel à direita, no editor Agrupar e substituir, selecione os valores que deseja adicionar ao grupo.

    Para remover valores do grupo, na seção superior do painel à direita, no editor Agrupar e substituir, desmarque a caixa de seleção próxima aos valores.

Selecionar vários valores para criar um grupo

  1. No painel Perfil ou Resultados, selecione o campo que deseja editar.

  2. Clique em Mais opções e selecione Agrupar e substituir > Seleção manual no menu de contexto.

  3. No painel à esquerda do editor Agrupar e substituir, selecione vários valores que você queira agrupar.

  4. No painel à direita do editor Agrupar e substituir, clique em Agrupar valores.

    Um novo grupo é criado usando o último valor selecionado como o nome do grupo. Para editar o nome do grupo, selecione o campo agrupado e edite o valor, clique com o botão direito do mouse ou pressione Ctrl + clique (no Mac) no campo agrupado e selecione Editar valor no menu.

Editar vários valores usando o editor Agrupar e substituir com correspondência difusa

Para pesquisar valores semelhantes e agrupá-los automaticamente, use um dos algoritmos de correspondência difusa. Os valores de campo são agrupados no valor que aparece com mais frequência. Consulte o valores agrupados e adicione ou remova valores no grupo conforme necessário.

Escolha uma das opções a seguir para agrupar valores:

  • Pronúncia: encontre e agrupe valores com sons parecidos. Essa opção usa o algoritmo Metaphone 3, que indexa palavras por suas pronúncias, e é mais adequado para palavras em inglês. Esse tipo de algoritmo é usado por muitos corretores ortográficos populares. Esta opção não está disponível para funções de dados.

  • Caracteres usuais: encontre e agrupe valores que possuem letras ou números em comum. Essa opção usa o algoritmo biométrico ngram, que indexa palavras por seus caracteres únicos depois de remover a pontuação, os duplicados e os espaços em branco. Esse algoritmo funciona para qualquer idioma suportado. Esta opção não está disponível para funções de dados.

    Por exemplo, esse algoritmo corresponderia nomes representados como "John Smith" e "Smith, John", pois ambos geram a chave "hijmnost". Como esse algoritmo não leva em consideração a pronúncia, o valor "Tom Jhinois" teria a mesma chave "hijmnost", e também seria incluído no grupo.

  • Ortografia: encontre e agrupe valores textuais com grafias parecidas. Essa opção usa o algoritmo de distância de Levenshtein para calcular uma distância de edição entre dois valores textuais com o uso de um limite padrão fixo. Ele depois os agrupa quando a distância de edição for menor do que o valor do limite. Esse algoritmo funciona para qualquer idioma suportado.

    A partir do Tableau Prep Builder versão 2019.2.3, esta opção está disponível para uso após a aplicação de uma função de dados. Nesse caso, ele corresponde os valores inválidos ao valor válido mais próximo usando a distância de edição. Se o valor padrão não estiver em sua amostra do conjunto de dados, o Tableau Prep Builder vai adicioná-lo automaticamente e marcá-lo como não existente no conjunto de dados original.

  • Pronúncia + Ortografia: (versão 2019.1.4 e posteriores) se você atribuir uma função de dados a seus campos, poderá usá-la para corresponder e agrupar valores com o valor padrão definido pela sua função de dados. Essa opção corresponde os valores inválidos ao valor válido mais semelhante com base na ortografia e na pronúncia. Se o valor padrão não estiver em sua amostra do conjunto de dados, o Tableau Prep Builder vai adicioná-lo automaticamente e marcá-lo como não existente no conjunto de dados original. Esta opção é mais adequada para palavras em inglês.

    Para obter mais informações, consulte Agrupar valores semelhantes por função de dados.

    Observação: no Tableau Prep Builder versão 2019.1.4 e 2019.2.1 essa opção foi rotulada como Correspondências de função de dados.

Agrupar valores semelhantes usando correspondência difusa
  1. No painel Perfil ou Resultados, selecione o campo que deseja editar.

  2. Clique em Mais opções e selecione Agrupar e substituir e, em seguida, selecione uma das opções a seguir:

    • Pronúncia

    • Caracteres usuais

    • Ortografia

    O Tableau Prep Builder encontra e agrupa valores correspondentes e os substitui pelo valor que ocorre com mais frequência no grupo.

  3. Consulte os agrupamentos, adicione e remova manualmente os valores ou edite-os conforme necessário. Em seguida clique em Concluído.

Ajustar os resultados ao agrupar valores de campo

Se você agrupar valores semelhantes por Ortografia ou Pronúncia, poderá alterar os resultados usando o controle deslizante no campo para ajustar o quão rigorosos são os parâmetros de agrupamento.

Dependendo de como o controle deslizante for definido, é possível ter mais controle sobre o número de valores incluídos em um grupo e o número de grupos que serão criados. Por padrão, o Tableau Prep Builder detecta a configuração de agrupamento ideal e mostra o controle deslizante nessa posição.

Ao alterar o limite, o Tableau Prep Builder analisa uma amostra dos valores para determinar o novo agrupamento. Os grupos gerados pela configuração são salvos e gravados no painel Alterações, mas a configuração de limite não é salva. Na próxima vez que o editor Agrupar e substituir for aberto, para editar a alteração existente ou para fazer uma nova alteração, o controle deslizante de limite será mostrado na posição padrão, permitindo que você faça ajustes com base no conjunto de dados atual.

  1. No painel Perfil ou Resultados, selecione o campo que deseja editar.

  2. Clique em Mais opções e selecione Agrupar e substituir e, em seguida, selecione uma das opções a seguir:

    • Pronúncia

    • Ortografia

    O Tableau Prep Builder encontra e agrupa valores correspondentes e os substitui pelo valor que ocorre com mais frequência no grupo.

  3. No painel esquerdo do editor Agrupar e substituir, arraste o controle deslizante para um dos cinco níveis de limite para alterar os resultados.

    Para definir um limite mais rigoroso, mova o controle deslizante para a esquerda. Isso resulta em menos correspondências e cria menos grupos. Para definir um limite mais flexível, mova o controle deslizante para a direita. Isso resulta em mais correspondências e cria mais grupos.

  4. Clique em Concluir para salvar as alterações.

Agrupar valores semelhantes por função de dados

Observação: no Tableau Prep Builder versão 2019.1.4 e 2019.2.1 essa opção foi rotulada como Correspondências de função de dados.

Você pode atribuir funções de dados a campos para ajudar a padronizar seus valores de campo e localizar rapidamente os valores que não são válidos. No Tableau Prep Builder versão 2019.1.4 e posterior, se você atribuir uma função de dados geográficos a um campo, poderá usar os valores na função de dados para agrupar e corresponder valores no seu campo de dados com base na ortografia e na pronúncia para padronizá-los. No Tableau Prep Builder versão 2019.2.3, você pode usar a Ortografia ou Ortografia + Pronúncia para agrupar e corresponder valores inválidos aos válidos.

Essas opções usam o valor padrão definido pela função de dados. Se o valor padrão não estiver em sua amostra do conjunto de dados, o Tableau Prep Builder vai adicioná-lo automaticamente e marcá-lo como não existente no conjunto de dados original. Para obter mais informações sobre como atribuir funções de dados a campos, consulte Atribuir funções de dados a seus dados.

Para usar funções de dados para agrupar valores, conclua as etapas a seguir.

  1. No painel Perfil ou Resultados, ou na grade de dados, clique no tipo de dados do campo.

  2. Selecione uma das funções de dados a seguir para o campo:

    • Aeroporto
    • Cidade
    • País/Região
    • Condado
    • Estado/Província

    O Tableau Prep Builder compara os valores de dados do campo a valores de domínio conhecidos para a função de dados selecionada e marca qualquer valor sem correspondência com um ponto de exclamação vermelho.

  3. Clique em Mais opções, selecione Agrupar e substituir, em seguida selecione uma das opções a seguir:

    • Ortografia: corresponde valores inválidos aos valores válidos mais próximos que diferem, adicionando, removendo ou substituindo caracteres.
    • Pronúncia + Ortografia: essa opção corresponde os valores inválidos ao valor válido mais semelhante com base na ortografia e na pronúncia.

      Observação: no Tableau Prep Builder versão 2019.1.4 ou 2019.2.1 essa opção foi chamada Correspondências de função de dados.

    O Tableau Prep Builder compara os valores por Ortografia ou ortografia e pronúncia e agrupa os valores semelhantes usando o valor padronizado para a função de dados. Se o valor padronizado não estiver no conjunto de dados, o valor será adicionado e marcado com um ponto vermelho.

Adicionar e identificar valores que não estão no conjunto de dados

Se quiser mapear valores no conjunto de dados a um novo valor não existente, é possível adicioná-lo usando o editor Agrupar e substituir Para identificar com facilidade qualquer valor que não estiver no conjunto de dados, esses valores são marcados com um ponto vermelho próximo ao nome no editor Agrupar e substituir.

Por exemplo, na imagem abaixo, Wyoming e Nevada não estão no conjunto de dados.

Alguns motivos para o valor não estar no conjunto de dados incluem os seguintes:

  • Você acabou de adicionar um novo valor manualmente.

  • O valor não está mais nos dados.

  • O valor está nos dados mas não está no conjunto de dados de amostra.

Para adicionar um novo valor:

  1. No painel Perfil ou Resultados, selecione o campo que deseja editar.

  2. Clique em Mais opções e selecione Agrupar e substituir > Seleção manual no menu de contexto.

  3. No painel à esquerda do editor Agrupar e substituir, clique no ícone de adição para adicionar um novo valor.

  4. Digite um novo valor no campo e pressione Enter para adicioná-lo.

  5. No painel à direita, selecione os valores que deseja mapear para o novo valor.

  6. (Opcional) Para adicionar novos valores ao valor mapeado, clique no botão de adição no painel à direita do editor Agrupar e substituir.

Agregar e agrupar valores

Às vezes, será necessário ajustar a granularidade de alguns dados, seja para reduzir a quantidade de dados produzidos do fluxo ou para alinhá-los a outros dados que possa querer unir em linhas ou colunas. Por exemplo, você pode querer agregar dados de vendas por cliente antes de unir uma tabela de vendas a uma tabela de cliente.

Se precisar ajustar a granularidade de seus dados, use a opção Adicionar agregação para criar uma etapa para agregar ou agrupar dados. A agregação ou agrupamento de dados depende do tipo de dados (cadeia de caracteres, número ou data).

  1. No painel Fluxo, clique no ícone de adição e selecione Adicionar agregação. Uma nova etapa de agregação é exibida no painel Fluxo e o painel Perfil é atualizado para mostrar o perfil de agregação e agrupamento.

  2. Para agrupar ou agregar campos, arraste-os do painel à esquerda para uma das colunas no painel à direita.

    Além disso, é possível:

    • Arrastar e soltar campos entre os dois painéis.

    • Pesquisar por campos na lista e selecionar apenas os campos que deseja incluir na agregação.

    • Clicar duas vezes em um campo para adicioná-lo ao painel à esquerda ou à direita.

    • Alterar a função do campo para adicioná-lo automaticamente ao painel adequado.

    • Clique em Adicionar todos ou Remover todos para aplicar ou remover em massa os campos.

    • Aplicar determinadas operações de limpeza a campos. Para obter mais informações sobre quais opções de limpeza estão disponíveis, consulte Aplicar operações de limpeza.

    Os campos são distribuídos entre as colunas Campos agrupados e Campos agregados, com base no tipo de dados. Clique nos cabeçalhos do tipo de agrupamento ou de agregação (por exemplo, MÉDIA ou SOMA) para alterar o tipo.

    Nas grades de dados abaixo do perfil de agregação e agrupamento, é possível ver uma amostra dos membros do agrupamento ou agregação.

    Todas as operações de limpeza feita nos campos são monitoradas no painel Alterações.

Obrigado pelo feedback! Ocorreu um erro ao enviar seu feedback. Tente novamente ou envie-nos uma mensagem..