War diese Seite hilfreich?
Ja Nein

Herstellen einer Verbindung zu Daten

Wenn Sie mit Tableau Prep Ihre Daten bereinigen und vorbereiten möchten, starten Sie ein neues Schema, indem Sie genauso wie in Tableau Desktop eine Verbindung zu Ihren Daten herstellen. Sie können auch ein vorhandenes Schema öffnen und dort weitermachen, wo Sie aufgehört haben.

Sie können die letzten Schemen direkt auf der Startseite anzeigen und darauf zugreifen. Dadurch sind laufende Arbeiten leicht zu finden. Nachdem Sie eine Verbindung zu Ihren Daten hergestellt haben, identifizieren Sie mithilfe der verschiedenen Optionen im Eingabeschritt die Daten, mit denen Sie in Ihrem Schema arbeiten möchten.

In diesem Artikel

Starten oder Öffnen eines Schemas

Tableau Prep unterstützt Verbindungen zu bekannten Datentypen sowie zu Tableau-Datenextrakten (.tde oder .hyper). Mit jeder neuen Version werden neue Connectoren hinzugefügt. Überprüfen Sie daher im Bereich Verbindungen, ob Ihr Connector verfügbar ist.

Hinweis: Wenn Sie ein Schema in einer Version öffnen, in der der Connector nicht unterstützt wird, wird das Schema zwar möglicherweise geöffnet, es enthält jedoch möglicherweise Fehler oder es wird nicht ausgeführt, sofern die Datenverbindungen nicht entfernt wurden.

Sie können auch benutzerdefinierte SQL-Abfragen verwenden, um eine Verbindung zu Daten auf dieselbe Art und Weise herzustellen, wie dies in Tableau Desktop möglich ist. Weitere Informationen finden Sie unter Herstellen einer Verbindung zu einer benutzerdefinierten SQL-Abfrage in der Hilfe zu Tableau Desktop und zur Webdokumenterstellung.

Wenn Sie überprüfen möchten, ob Sie eine Verbindung zu Ihren Daten herstellen können, öffnen Sie Tableau Prep, und klicken Sie auf die Schaltfläche Verbindung hinzufügen , um zu prüfen, ob im linken Bereich unter Verbinden ein Connector für Ihre Daten aufgelistet ist.

Hinweis: Bei manchen Connectoren müssen Sie einen Treiber herunterladen und installieren, bevor Sie eine Verbindung zu Ihren Daten herstellen können. Auf der Seite Treiber herunterladen auf der Tableau-Website finden Sie Links zum Herunterladen von Treibern und Installationsanweisungen.

Arbeiten mit Tableau-Datenextrakten

Wenn Sie eine Verbindung zu einem Tableau-Datenextrakt herstellen, entpackt Tableau Prep den Extrakt und die Hyper-Erweiterungen. Dabei wird viel temporärer Speicherplatz beansprucht, da die Schemavorgänge auf die resultierenden Rohdaten angewendet werden.

Das heißt, Sie benötigen möglicherweise mehr Arbeitsspeicher und Festplattenspeicherplatz für eine Datei dieser Größe. Für eine Extraktdatei mit 18 Spalten und 1,2 Millionen Zeilen, die 360 MB (8,5 GB unkomprimiert) groß ist, benötigen Sie beispielsweise bis zu 32 GB Arbeitsspeicher, 16 Kerne und 500 GB Festplattenspeicherplatz, damit die Datei beim Entpacken unterstützt wird.

Starten eines neuen Schemas

  1. Öffnen Sie Tableau Prep, und klicken Sie auf die Schaltfläche Verbindung hinzufügen .

  2. Wählen Sie in der Connector-Liste den Dateityp oder Server aus, auf dem Ihre Daten gehostet werden. Geben Sie bei entsprechender Aufforderung die zum Anmelden und Zugreifen auf Ihre Daten benötigten Informationen ein.

  3. Führen Sie im Bereich Verbindungen eine der folgenden Aktionen aus:

    • Wenn Sie eine Verbindung zu einer Datei hergestellt haben, doppelklicken Sie auf eine Tabelle, oder ziehen Sie eine Tabelle in den Bereich Schema, um das Schema zu starten.

      Bei einzelnen Tabellen erstellt Tableau Prep im Bereich Schema automatisch einen Eingabeschritt für Sie, wenn Sie Ihrem Schema Daten hinzufügen.

    • Wenn Sie eine Verbindung zu einer Datenbank hergestellt haben, wählen Sie eine Datenbank oder ein Schema aus, und doppelklicken Sie dann auf eine Tabelle, oder ziehen Sie eine Tabelle in den Bereich Schema, um das Schema zu starten.

Öffnen eines vorhandenen Schemas

Wenn Sie ein vorhandenes Schema öffnen möchten, führen Sie auf der Seite Start eine der folgenden Aktionen aus:

  • Wählen Sie unter Letzte Schemen ein Schema aus.

  • Klicke Sie auf Schema öffnen, um zu der Schemadatei zu navigieren und sie zu öffnen.

    Hinweis: Wenn Sie zur Startseite zurück wechseln möchten, wählen Sie Datei > Neu aus.

Aktualisieren von Dateien im Eingabeschritt

Wenn sich in Ihren Eingabedateien oder Tabellen Daten ändern, nachdem Sie mit der Arbeit an Ihrem Schema begonnen haben, können Sie den Eingabeschritt aktualisieren, um die neuen Daten einfließen zu lassen.

Verwenden Sie eine der folgenden Optionen:

  • Klicken Sie im Schemabereich im oberen Menü auf die Schaltfläche Aktualisieren, um alle Eingabeschritte zu aktualisieren. Klicken Sie zum Aktualisieren eines einzelnen Eingabeschritts auf den Drop-down-Pfeil neben der Aktualisierungsschaltfläche und wählen Sie in der Liste den Eingabeschritt aus.

  • Klicken Sie im Schemabereich mit der rechten Maustaste auf den zu aktualisierenden Eingabeschritt und wählen Sie im Menü die Option Aktualisieren aus.

  • Entfernen Sie den Eingabeschritt und fügen Sie ihn erneut dem Schema hinzu.

    1. Klicken Sie im Schemabereich mit der rechten Maustaste auf den zu aktualisierenden Eingabeschritt und wählen Sie im Menü die Option Entfernen aus.

      Dadurch wird Ihr Schema vorübergehend in einen Fehlerzustand versetzt.

    2. Stellen Sie eine neue Verbindung zu der aktualisierten Datei her.

    3. Ziehen Sie die Tabelle in den Schemabereich über dem zweiten Schritt in dem Schema, in dem Sie den Eingabeschritt hinzufügen möchten. Legen Sie sie auf der Option Hinzufügen ab, um sie erneut mit dem Schema zu verbinden.

(Zurück nach oben)


Bereinigen von Dateien mit dem Data Interpreter

Beim Arbeiten mit Microsoft Excel-Dateien können Sie mit dem Data Interpreter Untertabellen in Ihren Daten erkennen und belanglose Informationen entfernen, um die Daten für die Analyse vorzubereiten. Beim Aktivieren von Data Interpreter werden diese Untertabellen erkannt und im Abschnitt Tabellen des Bereichs Verbindungen als neue Tabellen aufgelistet.

Anschließend können Sie sie in den Bereich Schema ziehen. Wenn Sie Tableau Prep-Version 2018.1.2 oder höher verwenden, können Sie die Option Platzhaltervereinigung auf der Registerkarte Mehrere Dateien verwenden, um alle gefundenen Untertabellen in Ihrem Schema einzubeziehen. Weitere Informationen zum Verwenden der Platzhaltervereinigung im Eingabeschritt finden Sie unter Verwenden der Platzhaltervereinigung für Dateien und Datenbanktabellen.

Wenn Sie Data Interpreter deaktivieren, werden diese Tabellen aus dem Bereich Verbindungen entfernt. Wenn diese Tabellen bereits in dem Schema verwendet werden, führt dies zu Schemafehlern in den fehlenden Daten.

Hinweis: Data Interpreter erkennt derzeit lediglich Untertabellen in Ihren Excel-Arbeitsblättern.

Das Beispiel unten zeigt die Ergebnisse der Verwendung von Data Interpreter in einem Excel-Arbeitsblatt im Bereich Verbindungen. Data Interpreter hat zwei zusätzliche Untertabellen erkannt.

Vor Data Interpreter Nach Data Interpreter

Wenn Sie Data Interpreter verwenden möchten, führen Sie die folgenden Schritte aus:

  1. Wählen Sie Mit Daten verbinden und dann Microsoft Excel aus.

  2. Wählen Sie Ihre Datei aus, und klicken Sie auf Öffnen.

  3. Aktivieren Sie das Kontrollkästchen Data Interpreter verwenden.

  4. Ziehen Sie die neue Tabelle in den Bereich Schema, um sie in Ihr Schema einzubeziehen. Wenn Sie die alte Tabelle entfernen möchten, klicken Sie mit der rechten Maustaste auf den Eingabeschritt für die alte Tabelle, und wählen Sie Entfernen aus.

(Zurück nach oben)


Verwenden der Platzhaltervereinigung für Dateien und Datenbanktabellen

Beim Arbeiten mit mehreren Dateien oder Datenbanktabellen in einer einzelnen Datenquelle können Sie mithilfe einer Platzhaltersuche nach Dateien oder Tabellen suchen und anschließend die Daten vereinigen, um alle Datei- oder Tabellendaten in den Eingabeschritt einzubeziehen. Zum Vereinigen von Dateien müssen sich die Dateien in demselben unter- oder übergeordneten Verzeichnis befinden.

Zum Vereinigen von Datentabellen müssen sich die Tabellen in derselben Datenbank befinden, und die Datenbankverbindung muss die Platzhaltervereinigung unterstützen. Dieser Vereinigungstyp wird von den folgenden Datenbanken unterstützt:

  • Amazon Redshift

  • Microsoft SQL Server

  • MySQL

  • Oracle

  • PostgreSQL

Wenn Sie nach dem Erstellen der Vereinigung Dateien oder Tabellen hinzufügen oder entfernen, können Sie den Eingabeschritt aktualisieren, um Ihr Schema mit den neuen oder geänderten Daten zu aktualisieren.

Hinweis: Dieses Feature gilt momentan nur für Excel- und CSV-Dateien (Textdateien) und Datentabellen, die in den spezifischen oben aufgelisteten Datenbanken gespeichert sind.

Die Platzhaltervereinigung für Dateien ist in Tableau Prep-Version 2018.1.2 und höher verfügbar. Die Platzhaltervereinigung für Datenbanktabellen ist in Tableau Prep-Version 2018.3.1 und höher verfügbar. Das Bearbeiten einer Schemaverbindung mit diesem Vereinigungstyp kann in einer vorherigen Version zu Fehlern führen.

Wenn Sie Daten aus unterschiedlichen Datenquellen vereinigen müssen, können Sie dies in einem Vereinigungsschritt tun. Weitere Informationen zum Erstellen von Vereinigungsschritten finden Sie unter Verknüpfen oder Vereinigen von Daten.

Vereinigen von Dateien

Standardmäßig vereinigt Tableau Prep alle CSV-Dateien in demselben Verzeichnis wie die CSV-Datei, zu der Sie eine Verbindung hergestellt haben bzw. alle Arbeitsblätter in der Excel-Datei, zu der Sie eine Verbindung hergestellt haben. Wenn Sie Excel-Dateien mit dem Data Interpreter bereinigen und Sie Tableau Prep-Version 2018.1.2 oder höher verwenden, können Sie mithilfe der Platzhaltersuche beliebige Untertabellen vereinigen und hinzufügen, die Data Interpreter gefunden hat.

Wenn Sie die Standardvereinigung ändern möchten, verwenden Sie die folgenden Kriterien, um die in die Vereinigung einzubeziehenden Dateien oder Arbeitsblätter zu suchen:

  • Suchen in: Wählen Sie das Verzeichnis aus, das für die Suche nach Dateien verwendet werden soll. Aktivieren Sie das Kontrollkästchen Unterordner einbeziehen, um Dateien im Unterverzeichnis des übergeordneten Ordners einzubeziehen.

  • Dateien: Wählen Sie aus, ob die mit den Platzhaltersuchkriterien übereinstimmenden Dateien einbezogen oder ausgeschlossen werden sollen.

  • Übereinstimmung mit Muster (xxx*): Geben Sie ein Muster für die Platzhaltersuche ein, um Dateien zu finden, deren Dateiname diese Zeichen enthält. Wenn Sie beispielsweise "ord*" eingeben, werden alle Dateien mit diesem Dateinamen zurückgegeben. Lassen Sie dieses Feld leer, um alle Dateien in das angegebene Verzeichnis einzubeziehen.

So verwenden Sie die Platzhaltersuche zum Vereinigen von Dateien:

  1. Klicken Sie auf die Schaltfläche Verbindung hinzufügen , und klicken Sie unter Verbinden auf Textdatei, wenn es sich um CSV-Dateien handelt, bzw. auf Microsoft Excel, wenn es sich um Excel-Dateien handelt. Wählen Sie dann eine Datei aus, die geöffnet werden soll.

  2. Wählen Sie im Bereich Eingabe die Registerkarte Mehrere Dateien aus, und wählen Sie dann Platzhaltervereinigung aus.

    Das Beispiel unten zeigt eine Platzhaltervereinigung, bei der ein Übereinstimmungsmuster verwendet wird. Das Pluszeichen am Dateisymbol im Eingabeschritt "Orders_Central" im Bereich Schema gibt an, dass dieser Schritt eine Platzhaltervereinigung beinhaltet. Die Dateien in der Vereinigung werden unter Enthaltene Dateien aufgelistet.

  3. Verwenden Sie die Such-, Datei- und Übereinstimmungsmuster-Optionen, um die zu vereinigenden Dateien zu suchen.

  4. Klicken Sie auf Übernehmen, um die Dateien zu vereinigen.

Wenn Sie dem Schema einen neuen Schritt hinzufügen, können Sie im Feld Dateipfade im Profilbereich alle Dateien anzeigen, die dem Datensatz hinzugefügt wurden. Dieses Feld wird automatisch hinzugefügt.

Vereinigen von Datenbanktabellen

  1. Klicken Sie auf die Schaltfläche Verbindung hinzufügen und stellen Sie unter Verbinden eine Verbindung zu einer Datenbank her, die die Platzhaltervereinigung unterstützt.

  2. Ziehen Sie eine Tabelle in den Schemabereich.

  3. Wählen Sie im Bereich Eingabe die Registerkarte Mehrere Tabellen aus und wählen Sie dann Platzhaltervereinigung aus.

  4. Verwenden Sie die Suchoptionen sowie die Optionen Tabellen und Übereinstimmung mit Muster, um die zu vereinigenden Tabellen zu suchen.

    In die Vereinigung können nur Tabellen einbezogen werden, die im Bereich Verbindungen im Abschnitt Tabellen angezeigt werden. Die Platzhaltersuche nach Tabellen erfolgt nicht übergreifend über Schemen oder Datenbankverbindungen.

  5. Klicken Sie auf Übernehmen, um die Tabellendaten zu vereinigen.

    Wenn Sie dem Schema einen neuen Schritt hinzufügen, können Sie im Feld Tableau-Namen im Profilbereich alle Tabellen anzeigen, die dem Datensatz hinzugefügt wurden. Dieses Feld wird automatisch hinzugefügt.

Zusammenführen von Feldern nach einer Platzhaltervereinigung

Nachdem Sie eine Platzhaltervereinigung erstellt haben, sollten Sie Felder zusammenführen. Dies können Sie mit Ausnahme der Ein- oder Ausgabeschritte in einem beliebigen nachfolgenden Schritt tun. Weitere Informationen finden Sie unter Zusätzliche Optionen zum Zusammenführen von Feldern.

(Zurück nach oben)


Konfigurieren des Datensatzes

Wenn Sie bestimmen möchten, welcher Anteil Ihres Datensatzes in das Schema einbezogen werden soll, können Sie Ihren Datensatz konfigurieren. Beim Herstellen einer Verbindung zu Ihren Daten oder beim Ziehen von Tabellen in den Bereich Schema wird dem Schema automatisch ein Eingabeschritt hinzugefügt. Dies ist immer der erste Schritt in einem Schema. Sie können mit der rechten Maustaste auf den Eingabeschritt klicken, um ihn umzubenennen oder zu entfernen. Wenn Sie mit einer Excel- oder Textdatei verbunden sind, können Sie auch die Daten aus dem Eingabeschritt aktualisieren.

Im Eingabeschritt können Sie das Metadatenprofil für Ihren Datensatz anzeigen. Hier können Sie Felder suchen, Beispielwerte anzeigen und Aktionen zum Reduzieren der Datensatzgröße durchführen. Sie können z. B. die einzubeziehenden Felder oder die zu verwendenden Datenstichproben auswählen oder Filter auf ausgewählte Felder oder Zeilen anwenden.

Sie können auch die Feldeigenschaften konfigurieren, indem Sie den Datentyp oder Feldnamen für Felder ändern. Für Textdateien können Sie auch die Texteinstellungen konfigurieren.

Hinweis: Feldwerte mit eckigen Klammern werden automatisch in normale Klammerzeichen konvertiert.

Herstellen einer Verbindung zu einer benutzerdefinierten SQL-Abfrage

Wenn Ihre Datenbank die Verwendung von benutzerdefinierter SQL unterstützt, wird Benutzerdefinierte SQL in der Nähe des unteren Randes des Bereichs Verbindungen angezeigt. Doppelklicken Sie auf Benutzerdefinierte SQL, um die Registerkarte Benutzerdefinierte SQL zu öffnen. Dort können Sie Abfragen für vorab ausgewählte Daten eingeben und quellenspezifische Vorgänge anwenden. Nachdem die Abfrage den Datensatz abgerufen hat, können Sie die einzubeziehenden Felder auswählen, Filter anwenden oder den Datentyp ändern, bevor Sie Ihrem Schema Daten hinzufügen.

Weitere Informationen zum Verwenden benutzerdefinierter SQL finden Sie unter Herstellen einer Verbindung zu einer benutzerdefinierten SQL-Abfrage in der Hilfe zu Tableau Desktop und zur Webdokumenterstellung.

Auswählen von in das Schema einzubeziehenden Feldern

Im Bereich Eingabe wird eine Liste mit Feldern in Ihrem Datensatz angezeigt. Mithilfe des Feldes Suche können Sie Felder in der Liste suchen. Anschließend können Sie die einzubeziehenden oder auszuschließenden Felder mithilfe der Kontrollkästchen auswählen. Wenn Sie alle Felder in das Schema einbeziehen oder daraus ausschließen möchten, aktivieren bzw. deaktivieren Sie das Kontrollkästchen oben links im Raster.

Konfigurieren von Feldeigenschaften

Wenn Sie mit Textdateien arbeiten, wird die Registerkarte Texteinstellungen angezeigt. Dort können Sie Ihre Verbindung bearbeiten und Texteigenschaften konfigurieren, beispielsweise das Feldtrennzeichen für Textdateien. Sie können die Dateiverbindung auch im Bereich "Verbindungen" bearbeiten.

Wenn Sie mit Text- oder Excel-Dateien arbeiten, können Sie noch vor dem Starten des Schemas Datentypen korrigieren, die falsch abgeleitet wurden. Nach dem Starten des Schemas können Datentypen grundsätzlich in den Folgeschritten im Bereich Profil geändert werden.

Konfigurieren von Texteinstellungen in Textdateien

Wenn Sie die Einstellungen zum Analysieren von Textdateien ändern möchten, wählen Sie eine der folgenden Optionen aus:

  • Erste Zeile enthält Kopfzeile (Standard): Wählen Sie diese Option aus, um die erste Zeile als Feldbeschriftung zu verwenden.

  • Feldnamen automatisch generieren: Wählen Sie diese Option aus, wenn Tableau Prep die Kopfzeilen für Felder automatisch generieren soll. Die Namenskonvention für Felder folgt demselben Modell wie Tableau Desktop. Beispiel: F1, F2 usw.

  • Feldtrennzeichen: Wählen Sie in der Liste ein Zeichen aus, das zum Trennen der Spalten verwendet werden soll. Wählen Sie Andere aus, um ein benutzerdefiniertes Zeichen einzugeben.

  • Textqualifizierer: Wählen Sie das Zeichen aus, das die Werte in die Datei einschließt.

  • Zeichensatz: Wählen Sie den Zeichensatz aus, der die Textdateicodierung beschreibt.

  • Gebietsschema: Wählen Sie das Gebietsschema aus, das zum Analysieren der Datei verwendet werden soll. Diese Einstellung gibt an, welche Dezimal- und Tausendertrennzeichen verwendet werden.

Ändern von Datentypen

Wenn Sie den Datentyp für ein Feld ändern möchten, gehen Sie wie folgt vor:

  1. Klicken Sie auf den Datentyp für das Feld.

  2. Wählen Sie im Menü den neuen Datentyp aus.

Ändern von Feldnamen

Wenn Sie den Namen eines Feldes ändern möchten, wählen Sie in der Spalte Feldname den Namen aus, und geben Sie dann den neuen Namen in das Feld ein. Im Feldraster und im Schemabereich links neben dem Eingabeschritt wird eine Anmerkung hinzugefügt. Ihre Änderungen werden auch im Anpassungsbereich verfolgt.

Festlegen der Stichprobengröße

Tableau Prep beschränkt die in das Schema einbezogenen Daten standardmäßig auf eine repräsentative Stichprobe Ihrer Daten, um die maximale Leistung beizubehalten. Die Stichprobe wird per Berechnung der optimalen Anzahl an Zeilen basierend auf der Gesamtzahl Felder im Datensatz und den Datentypen für diese Felder bestimmt. Anschließend ruft Tableau Prep schnellstmöglich die optimale Anzahl an Zeilen für die berechnete Menge ab.

Je nachdem, wie die Stichprobe berechnet und zurückgegeben wurde, kann die resultierende Stichprobe alle benötigten Zeilen enthalten oder nicht. Wenn die erwarteten Daten nicht angezeigt werden, können Sie die Stichprobeneinstellungen ändern, um die Abfrage erneut auszuführen.

Hinweis: Wenn Stichproben Ihrer Daten gezogen werden, wird der Indikator Stichproben im Bereich Profil angezeigt. Dieser bleibt für alle von Ihnen hinzugefügten Schritte bestehen. Von Ihnen vorgenommene Änderungen werden auf die Stichprobe angewendet, mit der Sie im Schema arbeiten. Sämtliche Änderungen werden beim Ausführen des Schemas auf den gesamten Datensatz angewendet.

Wenn Sie die Stichprobeneinstellungen ändern möchten, wählen Sie einen Eingabeschritt aus, und wählen Sie dann auf der Registerkarte Stichprobe eine der folgenden Optionen aus:

  • Standard-Stichprobenmenge (Standard): Tableau Prep berechnet die Gesamtzahl zurückzugebender Zeilen.

  • Alle Daten verwenden: Rufen Sie unabhängig von der Größe alle Zeilen in Ihrem Datensatz ab. Dies kann dazu führen, dass die Leistung beeinträchtigt wird oder dass für Tableau Prep eine Zeitüberschreitung auftritt.

  • Feste Zeilenanzahl: Wählen Sie die Anzahl der aus dem Datensatz zurückzugebenden Zeilen aus. Die empfohlene Zeilenanzahl beträgt 1 Million Zeilen oder weniger. Wenn Sie die Zeilenanzahl auf mehr als 1 Million festlegen, kann dadurch die Leistung beeinträchtigt werden.

  • Schnellauswahl (Standard): Die Datenbank gibt die angeforderte Zeilenanzahl schnellstmöglich zurück. Dies können die ersten N Zeilen oder die Zeilen sein, die die Datenbank aus einer vorherigen Abfrage im Speicher zwischengespeichert hat.

  • Zufällige Stichprobe: Die Datenbank gibt die angeforderte Anzahl Zeilen zurück, sie untersucht jedoch alle Zeilen im Datensatz und gibt eine repräsentative Stichprobe aller Zeilen zurück. Beim ersten Abrufen der Daten kann diese Option die Leistung beeinträchtigen.

Anwenden von Filtern auf Felder im Eingabeschritt

Wenn Sie ein Feld filtern möchten, gehen Sie wie folgt vor:

  1. Klicken Sie in der Symbolleiste auf Werte filtern.

  2. Geben Sie im Berechnungs-Editor Ihre Filterkriterien ein.

In den weiteren Schritten des Schemas sind zusätzliche Filterfunktionen verfügbar. Weitere Informationen finden Sie unter Filtern von Werten.

(Zurück nach oben)