Spark SQL

Este artigo descreve como conectar o Tableau a um banco de dados do Spark SQL e configurar a fonte de dados. O Tableau pode conectar-se à versão 1.2.1 e posterior do Spark.

Você pode usar o conector Spark SQL para se vincular a um cluster Spark no Azure HDInsight, Azure Data Lake, Databricks ou Apache Spark.

Antes de começar

Antes de começar, colete estas informações de conexão:

  • O nome do servidor que hospeda o banco de dados ao qual deseja se conectar e o número da porta.

  • Método de autenticação:

    • Sem autenticação

    • Kerberos

    • Nome de usuário

    • Nome de usuário e senha

    • Serviço Microsoft HDInsight para Azure

  • Transporte. Suas escolhas dependem do método de autenticação escolhido e incluem o seguinte:

    • Binário

    • SASL

    • HTTP

  • Credenciais de entrada. Suas escolhas dependem do método de autenticação escolhido e podem incluir o seguinte:

    • Nome de usuário

    • Senha

    • Escopo

    • FQDN do host

    • Nome do serviço

    • Caminho HTTP

  • Você está se conectando a um servidor SSL?

  • (Opcional) Instrução SQL inicial para execução sempre que o Tableau se conecta

Driver necessário

Este conector exige um driver para se comunicar com o banco de dados. Você talvez já tenha esse driver instalado no computador. Se o driver não estiver instalado no computador, o Tableau exibirá uma mensagem na caixa de diálogo de conexão com um link para a página Download do driver, na qual é possível encontrar links de driver e instruções de instalação.

Fazer a conexão e configurar a fonte de dados

  1. Inicie o Tableau e, em Conectar, selecione Spark SQL. Para obter uma lista de conexões de dados, selecione Mais em A um servidor. Em seguida, execute estes procedimentos:

    1. Digite o nome do servidor que hospeda o banco de dados e o número da porta a ser usada.

    2. Conecte o banco de dados usando o SparkThriftServer. Observe que os as conexões SharkServer e SharkServer2 herdadas são fornecidas para o seu uso, mas não são compatíveis com o Tableau.

    3. Selecione o método de Autenticação. Em seguida, de acordo com a sua seleção, insira as informações solicitadas.

      Se o servidor estiver protegido por senha e você não estiver em um ambiente do Kerberos, insira o nome de usuário e a senha.

    4. (Opcional) Selecione SQL inicial para especificar um comando SQL a ser executado no início de cada conexão quando você abre a pasta de trabalho, atualiza uma extração, faz logon no Tableau Server ou publica no Tableau Server. Para obter mais informações, consulte Executar o SQL inicial.

    5. Selecione Fazer logon.

      Se o Tableau não conseguir fazer a conexão, verifique se as suas credenciais estão corretas. Se ainda assim não conseguir se conectar, seu computador está enfrentando problemas para localizar o servidor. Entre em contato com o administrador de banco de dados ou de rede.

  2. Na página da fonte de dados, faça o seguinte: 

    1. (Opcional) Selecione o nome da fonte de dados padrão na parte superior da página e, em seguida, insira um nome de fonte de dados exclusivo para uso no Tableau. Por exemplo, use uma convenção de nomeação de fonte de dados que ajude os outros usuários da fonte de dados a deduzir a qual fonte de dados devem se conectar.

    2. Na lista suspensa Esquema, selecione o ícone de pesquisa ou insira o nome do esquema na caixa de texto e selecione o ícone de pesquisa e, em seguida, o esquema.

    3. Na caixa de texto Tabela, selecione o ícone de pesquisa ou insira o nome da tabela e selecione o ícone de pesquisa, arraste a tabela até a tela e, em seguida, selecione a guia de planilha para iniciar a sua análise.

      Use SQL personalizado para se conectar a uma consulta específica em vez de à fonte de dados inteira. Para obter mais informações, consulte Conectar a uma consulta SQL personalizada.

Observação: a autenticação Kerberos para Spark SQL não aceita delegação. Isso significa que você não pode usar credenciais de Viewer como o método de Autenticação ao publicar uma pasta de trabalho ou fonte de dados para Tableau Server. Só é possível usar a conta Run As do Server.

Exemplo de fonte de dados do Spark SQL

Veja a seguir um exemplo de uma fonte de dados do Spark SQL usando o Tableau Desktop em um computador com Windows.

Fazer logon em um Mac

Se você usa o Tableau Desktop em um Mac, quando inserir o nome de servidor com o qual se conectar, use um nome de domínio totalmente qualificado, como mydb.test.example.lan, em vez de um nome de domínio relativo, como mydb ou mydb.test.

Como alternativa, é possível adicionar o domínio à lista de Domínios de Pesquisa no computador Mac para que, quando você se conectar, seja necessário fornecer apenas um nome de servidor. Para atualizar a lista de Domínios de Pesquisa, vá para Preferências do Sistema > Rede > Avançado e depois abra a guia DNS.

 

Consulte também

Databricks e Tableau - leia o guia de usuário do Tableau no site do Databricks.

Agradecemos o seu feedback. Ocorreu um erro ao enviar seu feedback.