Spark SQL

S’applique à : Tableau Cloud, Tableau Desktop, Tableau Prep, Tableau Server

Cet article décrit comment connecter Tableau à une base de données Spark SQL et configurer la source de données. Tableau peut se connecter à Spark version 1.2.1 et ultérieure.

Vous pouvez utiliser le connecteur Spark SQL pour vous connecter à un cluster Spark sur Azure HDInsight, Azure Data Lake, Databricks ou Apache Spark.

Avant de commencer

Avant de démarrer, rassemblez les informations de connexion suivantes :

Nom du serveur qui héberge la base de données à laquelle vous souhaitez vous connecter et numéro de port
Méthode d’authentification :
- Pas d’authentification
- Kerberos
- Nom d’utilisateur
- Nom d’utilisateur et mot de passe
- Microsoft Azure HDInsight Service
Transport. Vos choix dépendent de la méthode d’authentification que vous sélectionnez et incluent les éléments suivants :
- Binaire
- SASL
- HTTP
Informations de connexion. Vos choix dépendent de la méthode d’authentification que vous sélectionnez et peuvent inclure les éléments suivants :
- Nom d’utilisateur
- Mot de passe
- Domaine
- Hôte FQDN
- Nom de service
- Chemin d’accès HTTP
Vous vous connectez à un serveur SSL ?
(Facultatif) Expression SQL initial à exécuter à chaque connexion de Tableau

Pilote requis

Ce connecteur nécessite un pilote pour communiquer avec la base de données. Il se peut que le pilote requis soit déjà installé sur votre ordinateur. Si le pilote n’est pas installé sur votre ordinateur, Tableau affiche une message d’erreur dans la boîte de dialogue de connexion avec un lien vers la page Téléchargement de pilotes(Le lien s’ouvre dans une nouvelle fenêtre) où vous trouverez des liens vers les pilotes et des instructions d’installation.

Établir la connexion et configurer la source des données

Démarrez Tableau et sous Connexion, sélectionnez Spark SQL. Pour obtenir la liste complète des connexions de données, sélectionnez Plus sous Vers un serveur. Effectuez ensuite l’action suivante :
1. Entrez le nom du serveur qui héberge la base de données et le numéro du port à utiliser.
2. Connectez-vous à la base de données à l’aide de SparkThriftServer. Notez que les connexions héritées SharkServer et SharkServer2 vous sont proposées, mais elles ne sont pas prises en charge par Tableau.
3. Sélectionnez la méthode d’Authentification. Ensuite, en fonction de votre sélection, entrez les informations demandées.
4. Sélectionnez Connexion.
- Si le serveur est protégé par un mot de passe et que vous n’êtes pas dans un environnement Kerberos, vous devez entrer le nom et le mot de passe de l’utilisateur.
- Cochez la case Nécessite SSL lors de la connexion à un serveur SSL.
- (Facultatif) Sélectionnez SQL initial pour spécifier une commande SQL à exécuter au début de chaque connexion, par exemple lors de l’ouverture du classeur, de l’actualisation d’un extrait, de la connexion à Tableau Server ou de la publication sur Tableau Server. Pour plus d’informations, voir Exécuter SQL initial.

Si Tableau ne parvient pas à établir la connexion, vérifiez que vos informations d’identification sont correctes. Si la connexion n’aboutit toujours pas, cela signifie que votre ordinateur ne parvient pas à localiser le serveur. Contactez votre administrateur réseau ou votre administrateur de base de données.

Sur la page de la source de données, procédez comme suit :
1. (Facultatif) Sélectionnez le nom de la source de données par défaut en haut de la page, puis tapez un nom de source de données unique pour l’utiliser dans Tableau. Par exemple, utilisez une convention pertinente d’appellation de la source de données qui aide d’autres utilisateurs de la source de données à déduire à quelle source de données se connecter.
2. Dans la liste déroulante Schéma, sélectionnez l’icône de recherche ou saisissez le nom du schéma dans la zone de texte et sélectionnez l’icône de recherche, puis sélectionnez le schéma.
3. Dans la zone de texte Table, sélectionnez l’icône de recherche ou entrez le nom de la table et sélectionnez l’icône de recherche, déplacez la table vers le canevas, puis sélectionnez l’onglet de feuille pour démarrer votre analyse.
  Utilisez SQL personnalisé pour vous connecter à une requête spécifique plutôt qu’à la source de données entière. Pour plus d’informations, voir Se connecter à une requête SQL personnalisée.

Remarque : depuis la version 2018.3, l’authentification Kerberos pour Spark SQL prend en charge la délégation. Dans la version 2018.2 et versions antérieures, la délégation n’est pas prise en charge. Cela signifie que, dans les versions antérieures, vous ne pouvez pas utiliser l’option Informations d’identification du Viewer comme méthode d’Authentification lorsque vous publiez un classeur ou une source de données sur Tableau Server. Vous pouvez uniquement utiliser le Compte Exécuter en tant que serveur.

Connexion sur un Mac

Si vous utilisez Tableau Desktop sur un Mac, lorsque vous entrez le nom du serveur auquel vous connecter, utilisez un nom de domaine qualifié complet, par exemple mydb.test.ourdomain.lan, plutôt qu’un nom de domaine relatif tel que mydb ou mydb.test.

Vous pouvez sinon ajouter le domaine à la liste des Domaines de recherche pour l’ordinateur Mac. De cette manière, lorsque vous vous connectez, vous n’avez qu’à fournir le nom du serveur. Pour actualiser la liste des domaines de recherche, accédez à Préférences Système > Réseau > Avancé, puis ouvrez l’onglet DNS.

Voir également

Configurer des sources de données – Ajoutez des données supplémentaires à cette source de données ou préparez vos données avant de les analyser.
Créer des graphiques et analyser des données – Lancez votre analyse de données.

Databricks et Tableau(Le lien s’ouvre dans une nouvelle fenêtre) - Lisez le guide de l’utilisateur de Tableau sur le site Web Databricks.

Retour en haut

Merci de vos commentaires !