Untersuchen und Filtern von Daten

Machen Sie sich mit der Zusammenstellung Ihrer Daten vertraut, um nötige Änderungen und die Auswirkung der in das Schema einbezogenen Vorgänge besser zu verstehen.

Anzeigen von Größendetails für Ihre Daten

Nachdem Sie eine Verbindung zu Ihren Daten hergestellt haben, fügen Sie dem Schema eine Tabelle hinzu und fügen Sie dann einen Schritt hinzu. Im Profilbereich können Sie den aktuellen Status und die Struktur Ihrer Daten anzeigen und Nullen und Ausreißer ausfindig machen.

  • Anzahl Felder und Zeilen: In der oberen linken Ecke des Bereichs Profil finden Sie zusammenfassende Informationen bezüglich der Anzahl Felder und Zeilen in den Daten an einem bestimmten Punkt im Schema. Tableau Prep Builder rundet dabei auf den nächsten Tausender. In dem Beispiel unten enthält der Datensatz 21 Felder und 3.000 Zeilen.

    Wenn Sie mit der Maus auf die Anzahl Felder und Zeilen zeigen, können Sie die exakte Anzahl Zeilen sehen (in diesem Beispiel 2.848):


  • Datensatzgröße: Arbeiten Sie mit einer Teilmenge Ihrer Daten, indem Sie die Anzahl Zeilen angeben, die auf der Registerkarte Stichprobe im Bereich Eingabe einbezogen werden sollen.

  • Stichprobe: Damit Sie direkt mit Ihren Daten interagieren können, arbeitet Tableau Prep Builder mit einer Teilmenge Ihrer Rohdaten. Die Anzahl an Zeilen wird durch die Datentypen und Anzahl der gerenderten Felder bestimmt. Felder mit Zeichenfolgen nehmen mehr Speicherplatz ein als Ganzzahlen. Wenn Ihr Datensatz also 10 Felder mit Zeichenfolgen enthält, erhalten Sie also möglicherweise weniger Zeilen als bei 10 Feldern mit Ganzzahlen. Der Indikator Stichprobe wird neben den Größendetails im Bereich Profil angezeigt und gibt an, dass es sich hierbei um eine Teilmenge Ihres Datensatzes handelt. Weitere Informationen zu Stichproben finden Sie unter "Festlegen der Stichprobengröße" in Herstellen einer Verbindung zu Daten.

  • Anzahl eindeutiger Werte: Die Zahl neben den einzelnen Feldern repräsentiert die eindeutigen Werte, die in dem jeweiligen Feld enthalten sind. Tableau Prep Builder rundet dabei auf den nächsten Tausender. In dem Beispiel unten gibt es 3.000 eindeutige Werte, die im Feld "Beschreibung" angezeigt werden. Wenn Sie jedoch mit der Maus auf die Zahl zeigen, wird die exakte Anzahl eindeutiger Werte angezeigt.



Überprüfen der Ihren Daten zugeordneten Datentypen

Wie Tableau Desktop interpretiert auch Tableau Prep Builder die Daten in den Feldern, wenn Sie eine Verbindung in den Bereich Schema ziehen. Zudem wird automatisch ein Datentyp zugeordnet. Da verschiedene Datenbanken die Daten auf verschiedene Art und Weise verarbeiten können, ist die Interpretation von Tableau Prep Builder möglicherweise nicht immer korrekt.

Wenn Sie einen Datentyp ändern möchten, klicken Sie auf das Datentypsymbol, und wählen Sie im Kontextmenü den korrekten Datentyp aus. Sie können Zeichenfolgen- oder Ganzzahl-Datentypen in "Datum" oder "Datum & Uhrzeit" ändern, und Tableau Prep Builder löst den automatischen DateParse-Vorgang aus, um diese Datentypen zu ändern. Wenn die Änderung nicht erfolgreich verläuft, werden wie in Tableau Desktop in den Feldern stattdessen Nullwerte angezeigt, und Sie können eine Berechnung erstellen, um die Änderung vorzunehmen.

Weitere Informationen zur DateParse-Verwendung finden Sie unter Konvertieren eines Feldes in ein Datumsfeld in der Hilfe zu Tableau Desktop und zur Webdokumenterstellung.

Zuweisen von Datenrollen zu Ihren Daten

Um die Identifizierung ungültiger Feldwerte zu vereinfachen, können Sie Ihrem Feld eine Datenrolle zuweisen. Die Vorgehensweise ist dabei identisch mit dem Zuweisen eines Datentyps. Dadurch wird Tableau Prep Builder mitgeteilt, was Ihre Datenwerte darstellen, sodass die Werte automatisch validiert und diejenigen hervorgehoben werden können, die für die jeweilige Rolle ungültig sind.

Über Datenrollen erfährt Tableau Prep Builder, was die Feldwerte bedeuten oder repräsentieren. Wenn Sie beispielsweise mit Feldwerten für geografische Daten arbeiten, können Sie die Datenrolle Stadt zuordnen. Daraufhin vergleicht Tableau Prep Builder die Werte im Feld mit einer Reihe von bekannten Domänenwerten oder Mustern, um nicht übereinstimmende Werte zu identifizieren.

Hinweis: Alle Felder werden unabhängig voneinander analysiert, sodass der Stadt-Wert "Portland" im Bundesstaat "Washington" im Land "USA" zwar möglicherweise keine gültige Kombination aus Stadt und Bundesstaat ist, er aber nicht als solche identifiziert wird, weil es sich um einen gültigen Städtenamen handelt.

Tableau Prep Builder unterstützt die folgenden Datenrollen:

  • E-Mail

  • URL

  • Geografische Rollen (basierend auf aktuellen geografischen Daten und darauf, dass von Tableau Desktop dieselben Daten verwendet werden)

    • Flughafen
    • Ortskennzahl (USA)
    • CBSA/MSA
    • Stadt
    • Wahlbezirk (USA)
    • Bundesstaat/Region
    • Landkreis
    • NUTS Europa
    • Bundesland/Kanton
    • Postleitzahl

Wenn Sie in Tableau Prep Builder Version 2019.1.4 einem Feld eine Datenrolle zuweisen, können Sie diese Datenrolle auch verwenden, um Werte mit dem von Ihrer Datenrolle definierten Standardwert abzugleichen und zu gruppieren. Weitere Informationen zum Gruppieren von Werten mithilfe von Datenrollen finden Sie unter Gruppieren ähnlicher Werte nach Datenrollen.

Wenn Sie eine Datenrolle für Ihr Feld festlegen möchten, gehen Sie wie folgt vor:

  1. Klicken Sie im Bereich "Profil" oder "Ergebnisse" oder im Datenraster auf den Datentyp für das Feld.

  2. Wählen Sie die Datenrolle für das Feld aus.

    Tableau Prep Builder vergleicht die Datenwerte des Feldes mit bekannten Domänenwerten oder Mustern (für E-Mail oder URL) für die von Ihnen ausgewählte Datenrolle und markiert nicht übereinstimmende Werte mit einem roten Ausrufezeichen.

  3. Klicken Sie auf den Dropdown-Pfeil für das Feld und wählen Sie im Bereich Werte anzeigen eine Option aus, um alle Werte oder nur die Werte anzuzeigen, die für die Datenrolle gültig oder ungültig sind.

  4. Verwenden Sie die Bereinigungsoptionen im Menü Weitere Optionen für das Feld, um ungültige Werte zu korrigieren. Weitere Informationen zum Bereinigen von Feldwerten finden Sie unter Anwenden von Bereinigungsvorgängen.

Anzeigen der Verteilung von Werten oder eindeutigen Werten

Tableau Prep Builder gruppiert numerische Werte, Datumswerte und Datums-/Uhrzeitwerte in einem Feld standardmäßig in Buckets. Diese Buckets werden auch als bin-Verzeichnisse bezeichnet. Durch die bin-Verzeichnisse wird sichergestellt, dass Sie die Verteilung der Werte als Ganzes anzeigen und Ausreißer und Nullwerte schnell identifizieren können. Die bin-Größe wird basierend auf den minimalen und maximalen Werten im Feld berechnet, und die Nullwerte werden immer oben in der Verteilung angezeigt.

Bestell- und Liefertermine werden beispielsweise nach Jahr zusammengefasst oder in Partitionen angeordnet. Jede Partition repräsentiert ein Jahr vom Januar des ersten Jahres bis zum Januar des Folgejahres und ist entsprechend beschriftet. Da einige Bestell- und Liefertermine in den späteren Abschnitt der Jahre 2018 und 2019 fallen, wird für diese Werte eine Partition für das Folgejahr erstellt.

Wenn ein diskretes (oder kategorisches) Datenfeld viele Zeilen oder eine Verteilung enthält, die aufgrund ihrer Größe im Feld nur mit Bildlauf angezeigt werden kann, können Sie rechts neben dem Feld eine zusammengefasste Verteilung anzeigen. Sie können per Klick und Bildlauf durch die Verteilung zu bestimmten Werten navigieren.

Wenn Ihre Daten numerische Felder oder Datumsfelder enthalten, können Sie die Ansicht wechseln, um die detaillierte (diskrete) Version der Werte oder eine zusammengefasste (fortlaufende) Version der Werte anzuzeigen. In der zusammengefassten Ansicht werden der Wertebereich in einem Feld und die Häufigkeit angezeigt, mit der bestimmte Werte auftreten.

Dieser Wechsel der Ansicht kann hilfreich sein, um eindeutige Werte (wie die Zahl "3" für die Datensätze in einem Feld) oder die Verteilung von Werten (wie die Summe aller "3" Datensätze in einem Feld) zu isolieren.

So wechseln Sie die Ansicht:

  1. Klicken Sie im Bereich "Profil" oder "Ergebnisse" oder im Datenraster auf das Menü Weitere Optionen für ein numerisches Feld oder ein Datumsfeld.

  2. Wählen Sie im Kontextmenü die Option Detail aus, um die detaillierte Version der Werte anzuzeigen, oder wählen Sie Zusammenfassung aus, um die verteilte Version der Werte anzuzeigen.

Sortieren von Werten und Feldern

Mithilfe von Sortieroptionen auf einer Profilkarte können Sie die Partitionen (die Anzahl der Werte repräsentiert durch die Verteilungsbalken) in aufsteigender oder absteigender Reihenfolge bzw. die individuellen Feldwerte in alphabetischer Reihenfolge sortieren.

Wenn Sie die Reihenfolge Ihrer Felder neu anordnen möchten, wählen Sie im Bereich Profil oder Ergebnisse oder im Raster Daten einfach eine Profilkarte oder ein Feld im Datenraster aus und ziehen Sie es, bis die schwarze Ziellinie angezeigt wird. Legen Sie es dann ab. Der Bereich "Profil" und das Datenraster werden synchronisiert, sodass das Feld an beiden Stellen in derselben Reihenfolge angezeigt wird.

Markieren von Feldern und Werten in einem Schema

In Tableau Prep Builder können Felder und Werte in Ihren Schemadaten leicht gefunden werden. Im Schemabereich können Sie nachvollziehen, woher ein Feld stammt und wo es im Schema verwendet wird, oder Sie können in einer Profilkarte oder im Datenraster auf einzelne Werte klicken, um zugehörige oder identische Werte zu markieren.

Verfolgen von Feldern in einem Schema

In Tableau Prep Builder-Version 2018.3.3 und höher können Sie alle Stellen markieren, an denen ein Feld in einem Schema verwendet wird, und nachvollziehen, woher es stammt. Dies hilft Ihnen bei der Ermittlung fehlender Werte oder bei der Problembehandlung für ein Schema, wenn nicht die erwarteten Ergebnisse angezeigt werden.

Klicken Sie in einem Bereinigungsschritt im Bereich Profil oder in einem anderen Schritt im Bereich Ergebnisse auf ein Feld. Daraufhin wird im Schemabereich der Pfad markiert, unter dem das Feld verwendet wird.

Hinweis: Diese Option ist nicht für Eingabe- oder Ausgabeschritttypen verfügbar.

Anzeigen zugehöriger Werte

Mithilfe von Hervorhebungen können Sie zugehörige Werte feldübergreifend suchen. Wenn Sie im Bereich "Profil" oder "Ergebnisse" auf der Karte Profil auf einen Wert klicken, werden alle zugehörigen Werte in den anderen Feldern blau hervorgehoben. Die blaue Farbe zeigt die Beziehungsverteilung zwischen dem von Ihnen ausgewählten Wert und den Werten in den anderen Feldern an.

Wenn Sie beispielsweise zugehörige Werte hervorheben möchten, klicken Sie im Bereich Profil auf einen Wert in einem Feld. Die zugehörigen Werte in anderen Feldern werden blau, und der Anteil des blau hervorgehobenen Balkens stellt den Grad der Zuordnung dar.

Hervorheben von identischen Werten

Wenn Sie im Datenraster einen Wert auswählen, werden alle identischen Werte ebenfalls hervorgehoben. Diese Hervorhebungen helfen Ihnen beim Identifizieren von Mustern oder Unregelmäßigkeiten in Ihren Daten.

Beibehalten oder Entfernen von Feldern

Während Sie mit Ihren Daten in Ihrem Schema arbeiten, möchten Sie möglicherweise unerwünschte Felder entfernen. Wählen Sie im Profilbereich oder im Datenraster in einem Bereinigungs- oder Aktionsschritt ein oder mehrere Felder aus, klicken Sie mit der rechten Maustaste oder Strg-Klick (MacOS) und wählen Sie Entfernen, um die ausgewählten Felder zu entfernen, oder wählen Sie Nur beibehalten (Version 2019.2.2 und höher), um nur die ausgewählten Felder beizubehalten und alle nicht ausgewählten Felder zu entfernen.

Suchen nach Feldern und Werten

Im Bereich "Profil" oder "Ergebnisse" können Sie nach Feldern oder Werten suchen, die für Sie von besonderem Interesse sind, und mithilfe der Suchergebnisse können Sie Ihre Daten filtern.

Geben Sie zum Suchen nach Feldern einen vollständigen oder unvollständigen Suchbegriff in das Suchfeld auf der Symbolleiste ein.

So suchen Sie einen Wert in einem Feld:

  1. Klicken Sie auf das Suchsymbol für ein Feld, und geben Sie einen Wert ein.

  2. Wenn Sie erweiterte Suchoptionen verwenden möchten, klicken Sie auf die Schaltfläche Suchoptionen....

  3. Wenn Sie die Daten mithilfe der Suchkriterien filtern möchten, wählen Sie Nur beibehalten oder Ausschließen aus.

    Im Bereich Schema wird über den betroffenen Schritten ein Filtersymbol angezeigt.

(Zurück nach oben)


Filtern von Werten

Eine bequeme Methode zum Filtern eines Werts besteht darin, ihn auf einer Profilkarte oder in einem Datenraster auszuwählen, mit der rechten Maustaste darauf zu klicken und dann Nur beibehalten oder Ausschließen auszuwählen. Sie können auch die Option Wert bearbeiten auswählen, um den Wert inline zu bearbeiten.

Daten können in einem beliebigen Schritt im Schema gefiltert werden. Klicken Sie zum Hinzufügen eines Filters auf der Profilkarte oder im Datenraster auf das Menü Weitere Optionen.

Hinweis: Wenn Sie im Datenraster über das Menü Weitere Optionen einen Filter anwenden möchten, klicken Sie auf die Schaltfläche Profilbereich ausblenden und klicken Sie dann für das zu filternde Feld auf Weitere Optionen.

Für die einzelnen Datentypen verfügbare Filter

Datentyp Verfügbare Filter
Zeichenfolge Berechnung, Platzhalterübereinstimmung, Nullwerte
Zahl Berechnung, Wertebereich, Nullwerte
Datum und Uhrzeit Berechnung, Wertebereich, Relatives Datum, Nullwerte

Verwenden eines Berechnungsfilters

Wenn Sie Berechnung auswählen, wird das Dialogfeld Filter hinzufügen geöffnet. Geben Sie die Berechnung ein, stellen Sie sicher, dass sie gültig ist, und klicken Sie auf Speichern.

Verwenden eines Filters für Wertebereiche

Wenn Sie Wertebereich auswählen, können Sie einen Bereich angeben oder Minimal- oder Maximalwerte festlegen.

Verwenden eines Filters für Datumsbereiche

Wenn Sie Datumsbereich auswählen, können Sie einen Datumsbereich angeben oder ein Minimal- oder Maximaldatum festlegen.

Verwenden eines Filters für das relative Datum

Wenn Sie Relative Datumsangaben auswählen, können Sie den Datumsbereich basierend auf dem Jahr, Quartal, Monat, der Woche oder dem Tag filtern. Sie können auch einen Anker für ein bestimmtes Datum konfigurieren und alle Nullwerte einbeziehen.

Verwenden eines Filters vom Typ "Platzhalterübereinstimmung"

Wenn Sie Platzhalterübereinstimmung auswählen, können Sie die Feldwerte filtern, sodass nur die Werte beibehalten oder ausgeschlossen werden, die mit Ihren Kriterien übereinstimmen. Wählen Sie im Filter-Editor die Registerkarte Nur beibehalten oder Ausschließen aus, geben Sie einen Wert für die Übereinstimmung ein, und legen Sie dann die Kriterien zum Zurückgeben der gewünschten Werte fest.

Die gefilterten Ergebnisse werden im linken Bereich des Filter-Editors angezeigt, sodass Sie Ihre Ergebnisse überprüfen und mit ihnen experimentieren können. Sobald die gewünschten Ergebnisse vorliegen, klicken Sie auf Fertig, um die Änderung zu übernehmen.

Verwenden eines Filters vom Typ "Nullwerte"

Wenn Sie Nullwerte auswählen, können Sie die Werte im ausgewählten Feld filtern, sodass nur Nullwerte angezeigt oder alle Nullwerte ausgeschlossen werden.

Danke für Ihr Feedback. Beim Senden Ihres Feedbacks ist ein Fehler aufgetreten. Versuchen Sie es erneut oder senden Sie uns eine Nachricht.