Cette page vous a-t-elle été utile ?
Oui Non

Spark SQL

Cet article décrit comment connecter Tableau à une base de données Spark SQL et configurer la source de données. Tableau peut se connecter à Spark version 1.2.1 et ultérieure.

Vous pouvez utiliser le connecteur Spark SQL pour vous connecter à un cluster Spark sur Azure HDInsight, Azure Data Lake, Databricks ou Apache Spark.

Avant de commencer

Avant de démarrer, rassemblez les informations de connexion suivantes :

  • Nom du serveur qui héberge la base de données à laquelle vous souhaitez vous connecter et numéro de port

  • Méthode d'authentification :

    • Pas d'authentification

    • Kerberos

    • Nom d'utilisateur

    • Nom d'utilisateur et mot de passe

    • Microsoft Azure HDInsight Service

  • Transport. Vos choix dépendent de la méthode d'authentification que vous sélectionnez et incluent les éléments suivants :

    • Binaire

    • SASL

    • HTTP

  • Informations de connexion. Vos choix dépendent de la méthode d'authentification que vous sélectionnez et peuvent inclure les éléments suivants :

    • Nom d’utilisateur

    • Mot de passe

    • Domaine

    • Hôte FQDN

    • Nom de service

    • Chemin d'accès HTTP

  • Vous vous connectez à un serveur SSL ?

  • (Facultatif) Expression SQL initial à exécuter à chaque connexion de Tableau

Pilote requis

Ce connecteur nécessite un pilote pour communiquer avec la base de données. Il se peut que le pilote requis soit déjà installé sur votre ordinateur. Si le pilote n'est pas installé sur votre ordinateur, Tableau affiche une message d'erreur dans la boîte de dialogue de connexion avec un lien vers la page Téléchargement de pilotes où vous trouverez des liens vers les pilotes et des instructions d'installation.

Établir la connexion et configurer la source des données

  1. Démarrez Tableau et sous Connexion, sélectionnez Spark SQL. Pour obtenir la liste complète des connexions de données, sélectionnez Plus sous Vers un serveur. Effectuez ensuite l'action suivante :

    1. Entrez le nom du serveur qui héberge la base de données et le numéro du port à utiliser.

    2. Connectez-vous à la base de données à l'aide de SparkThriftServer. Notez que les connexions héritées SharkServer et SharkServer2 vous sont proposées, mais elles ne sont pas prises en charge par Tableau.

    3. Sélectionnez la méthode d'Authentification. Ensuite, en fonction de votre sélection, entrez les informations demandées.

      Si le serveur est protégé par un mot de passe et que vous n'êtes pas dans un environnement Kerberos, vous devez entrer le nom et le mot de passe de l'utilisateur.

    4. (Facultatif) Sélectionnez SQL initial pour spécifier une commande SQL à exécuter au début de chaque connexion, par exemple lors de l'ouverture du classeur, de l'actualisation d'un extrait, de la connexion à Tableau Server ou de la publication sur Tableau Server. Pour plus d'informations, consultez Exécuter SQL initial.

    5. Sélectionnez Connexion.

      Si Tableau ne parvient pas à établir la connexion, vérifiez que vos informations d'identification sont correctes. Si la connexion n'aboutit toujours pas, cela signifie que votre ordinateur ne parvient pas à localiser le serveur. Contactez votre administrateur réseau ou votre administrateur de base de données.

  2. Sur la page de la source de données, procédez comme suit : 

    1. (Facultatif) Sélectionnez le nom de la source de données par défaut en haut de la page, puis tapez un nom de source de données unique pour l'utiliser dans Tableau. Par exemple, utilisez une convention pertinente d'appellation de la source de données qui aide d'autres utilisateurs de la source de données à déduire à quelle source de données se connecter.

    2. Dans la liste déroulante Schéma, sélectionnez l'icône de recherche ou saisissez le nom du schéma dans la zone de texte et sélectionnez l'icône de recherche, puis sélectionnez le schéma.

    3. Dans la zone de texte Table, sélectionnez l'icône de recherche ou entrez le nom de la table et sélectionnez l'icône de recherche, déplacez la table vers le canevas, puis sélectionnez l'onglet de feuille pour démarrer votre analyse.

      Utilisez SQL personnalisé pour vous connecter à une requête spécifique plutôt qu'à la source de données entière. Pour plus d'informations, consultez Se connecter à une requête SQL personnalisée.

Remarque : L'authentification Kerberos pour Spark SQL ne prend pas en charge la délégation. Ceci a pour conséquence que vous ne pouvez pas utiliser les informations d'identification de l'observateur comme méthode d'authentification lorsque vous publiez un classeur ou une source de données sur Tableau Server. Vous ne pouvez utiliser que Compte Exécuter en tant que du serveur.

Exemple de source de données Spark SQL

Voici un exemple de source de données Spark SQL utilisant Tableau Desktop sur un ordinateur Windows :

Connexion sur un Mac

Si vous utilisez Tableau Desktop sur un Mac, lorsque vous entrez le nom du serveur auquel vous connecter, utilisez un nom de domaine qualifié complet, par exemple mydb.test.ourdomain.lan, plutôt qu'un nom de domaine relatif tel que mydb ou mydb.test.

Vous pouvez sinon ajouter le domaine à la liste des Domaines de recherche pour l'ordinateur Mac. De cette manière, lorsque vous vous connectez, vous n'avez qu'à fournir le nom du serveur. Pour actualiser la liste des domaines de recherche, accédez à Préférences Système > Réseau > Avancé, puis ouvrez l'onglet DNS.

 

Voir également

Databricks et Tableau - Lisez le guide de l'utilisateur de Tableau sur le site Web Databricks.