Tableau Prep Builder の新機能

現在サポートされているバージョンに対する新機能の概要について説明します。

: バージョン 2019.1.2 以降、Tableau Prep は Tableau Prep Builder という名称に変更されました。

バージョン 2019.2.3 での追加

データの検証とフィルタリング

フィルター処理する特定の値を選択する

新しい [選択した値] フィルターを使用して、サンプルに含まれていない値であっても、フィールドで保持または除外する値を選択できるようになりました。[プロファイル] ペイン、[結果] ペイン、またはデータ グリッドで、[その他のオプション] ボタンをクリックしてから [フィルター] > [選択した値] を選択します。

この新しい視覚的なインジケーターによって、保持または除外する値を選択し、選択した内容を視覚的に表示できるようになります。データのサンプルを使用していて、使用中のサンプルにない値を含めるか除外する場合は、必要な値を追加するだけで、Tableau Prep Builder でこれらの新しい値を保持または除外するオプションが適用されます。

フィールド値のフィルタリングに関する詳細については、値のフィルターを参照してください。

ワンクリックでフィールドを複製する

これまで、フィールドでクリーニング操作を試行する際に元のデータは変更したくない場合は、計算を書き込んでフィールドを複製する必要がありました。このフィールドの複製が、ワンクリックで簡単に実行できるようになりました。複製するフィールドを選択してから、[その他のオプション] メニューで [フィールドの複製] を選択します。

新しいフィールドが同じ名前に修飾語句を加えた形式で作成され、[プロファイル] ペイン、データ グリッド、または [結果] ペインの一番左に配置されます。たとえば、"Ship Date-1" のようになります。

フィールドおよびその他のクリーニング オプションの複製に関する詳細については、フィールドの複製 (バージョン 2019.2.3 以降)を参照してください他のステップでクリーニング操作を適用

データのクリーニングと加工

あいまい一致とクリーニングの推奨事項を使用して無効なデータの役割の値を修正する

データの役割を使用すると、有効でないフィールド値をすばやく特定できます。データの役割を割り当てたら、[スペル] または [読み方 + スペル] のあいまい一致アルゴリズムのいずれかを使用して、データの役割の無効な値とそのデータの役割に類似する標準値をすばやくグループ化および一致させます。

さらに、フィールドに対してデータの役割を提案します。Tableau Prep Builder では、[スペル] および [読み方 + スペル] のアルゴリズムを使用して、データの役割に割り当てられたフィールドの無効な値を自動的に修正する方法についても提案できるようになりました。提案される修正が検出されると、プロファイル カードに電球 アイコンが表示されます。アイコンをクリックすると提案された変更が適用され、無効な値を自動的にグループ化してそのデータの役割に類似する標準値に置き換えます。

この機能は、次のデータの役割にのみ使用できます。

  • 空港
  • 市区町村
  • 国/地域
  • 都道府県/州

データの役割をフィールドに適用する方法の詳細については、データへのデータの役割の割り当てを参照してください。グループ化と置換を使用してデータの役割の無効な値を修正する方法の詳細については、類似の値をデータの役割でグループ化するを参照してください。

バージョン 2019.2.2 での追加

データへの接続

その他のデータベース (ODBC) コネクタを使用してさらに多くのデータに接続する

[接続] ペインにリストされていないデータ ソースへ接続する必要がある場合は、SQL 標準をサポートするその他のデータベース (ODBC) コネクタを使用して任意のデータ ソースに接続し、ODBC API を実装できます。その他のデータベース (ODBC) コネクタを使用したデータへの接続は、Tableau Desktop での使用方法に似ていますが、いくつかの相違点があります。

  • 接続できるのは、DSN (データ ソース名) オプションを使用する場合のみです。
  • Tableau Server でフローをパブリッシュして実行するには、サーバーが一致する DSN を使用して構成されている必要があります。
  • Windows と MacOS の両方に単一の接続エクスペリエンスがあります。ODBC ドライバー (Windows) の接続属性の確認を求める機能はサポートされていません。
  • Tableau Prep Builder でサポートされているのは、64ビットドライバーのみです。

その他のデータベース (ODBC) コネクタを使用したデータへの接続に関する詳細については、データへの接続を参照してください。

データへの接続時に初期 SQL コマンドを指定する

対応するデータベースへの接続時に初期 SQL コマンドを指定できるようになりました。このコマンドは、データベースへの接続時に実行されます。たとえば、Amazon Redshift に接続する場合、データベースへの接続時に、インプット ステップでフィルターを追加するときのように、SQL ステートメントを入力してフィルターを適用できます。SQL コマンドは、データがサンプリングされ Tableau Prep Builder に読み込まれる前に適用されます。

初期 SQL コマンドを変更してインプット ステップを更新すると、初期 SQL コマンドが再度実行され、インプット ステップが更新されます。フローを実行すると、すべてのデータを処理する前に初期 SQL コマンドが実行されます。また、Tableau Server でフローをスケジュールすると、データの読み込み操作の一部として初期 SQL が毎回実行されます。

詳細については、データへの接続を参照してください。

: Tableau Prep Builder の初期 SQL では、パラメーターがまだサポートされていません。

データの検証とフィルタリング

データのクリーニング中に必要なフィールドのみの保持

以前のリリースでは、データへの接続後にチェック ボックスをオフにすることでインプット ステップの不要なフィールドを削除できました。クリーニングまたはアクション ステップでは、1 つ以上のフィールドを選択して右クリックするだけで不要なフィールドを削除できました。[プロファイル] ペインまたはデータ グリッドで 1 つ以上のフィールドを選択し、右クリックすると、選択したフィールドのみを保持して他のすべてのフィールドが削除されるようになりました。

詳細については、フィールドの保持または削除を参照してください。

データのクリーニングと加工

フローの再配置ステップ

大規模で複雑なフローを構築したものの、Tableau Prep Builder を使用した既定のレイアウトでは、このフローを把握するのが難しかったことはありますか。キャンバス内のステップを選択して移動することで、フローをわかりやすく再編成できるようになりました。たとえば、交差するフロー線を修正したり、フローのステップを移動して余分な空白を除去したりできるほか、フローのステップを再配置して一連のイベントを明確に表示することもできます。

次のようなフローは紛らわしく把握することが困難です。

この新機能を使用すると、フロー内の 1 つ以上のステップを選択し、それらを上下左右にドラッグして適切な場所にドロップできます。

: いくつかの制約が適用され、左から右へと移動するプロセスのフローを妨害するような位置にフローのステップを移動することはできません。許可された場所にフローのステップをドラッグすると、オレンジ色のボックスが表示されます。許可されていない場所ではオレンジ色のボックスが表示されず、ステップをドロップしようとしても元の場所に戻ってしまいます。

詳細については、フローの構築を参照してください。

バージョン 2019.2.1 での追加

データへの接続

新しいデータベース コネクタを使用してさらに多くのデータに接続する

データへの接続やデータのクリーニングに役立つコネクタがさらに追加されました。以下のデータベースに格納されているデータに接続できるようになりました。

  • Amazon Athena
  • その他のデータベース (JDBC)

特定のコネクタへの接続に関する詳細については、「Tableau Desktop と Web 作成のヘルプ」の「サポートされるコネクタ」を参照してください。フローを構築するためのデータへの接続の詳細については、データへの接続を参照してください。

フロー データを最新に維持する

フローをパブリッシュするときにファイルのセーフ リストの場所を表示する

Tableau Server にフローをパブリッシュし、Tableau Prep Conductor を使用してフローが自動的に実行されるスケジュールを設定したり、フローの入力または出力を更新したりします。フローにネットワーク共有への接続を使用したインプットまたは出力ステップが含まれている場合、システム管理者はファイルの場所を事前に組織のセーフ リスト内に追加しておく必要があります。追加しない場合、Tableau Server でフローの実行を試行すると失敗します。

Tableau Prep Builder のバージョン 2019.2.1 以降でネットワーク共有への接続を使用したインプットまたは出力ステップを含むフローをパブリッシュすると、パブリッシュ時にファイルを組織のセーフ リストに含める必要があるかどうかの通知を受けます。セーフ リストに記載された場所を確認するには、警告メッセージ内のリンクをクリックして、表示された場所のいずれかにファイルを移動します。

フローのパブリッシュの詳細については、Tableau Server へのフローのパブリッシュを参照してください。組織のセーフ リストにファイルの場所を追加する方法の詳細については、手順 4 - 入力場所と出力場所をセーフ リストに登録するを参照してください。

拡張機能

ユーザー インターフェイスに使用する言語が 10 種類の中から選択可能に

ユーザー インターフェイス (メニュー、メッセージなど) の構成に選択できる言語に、以下の 2 言語が追加されました。

  • en_GB (イギリス英語)

  • zh_TW (繁体字中国語)

表示言語設定の詳細については、Tableau Desktop および Tableau Prep Builder 導入ガイドの「表示言語の設定」を参照してください。

フローのサムネイル ビューを使用して Tableau Server のフローを簡単に検索可能

フローを Tableau Server にパブリッシュする場合に、サムネイル ビューに切り替えてフローのレイアウトをグラフィック表示し、フローを一目で簡単に確認することができるようになりました。

バージョン 2019.1.4 での追加

データへの接続

新しいデータベース コネクタを使用してさらに多くのデータに接続する

データへの接続やデータのクリーニングに役立つ新しいコネクタがさらに追加されました。以下のデータベースに格納されているデータに接続できるようになりました。

  • SAP HANA
  • Azure SQL Data Warehouse
  • MariaDB

: SAP HANA を使用したデータへの接続では、フローを開くとき、および初期 SQL を使用して接続のクエリを実行するときに変数とパラメーターを求める機能はサポートされていません。

特定のコネクタへの接続については、Tableau Desktop および Web 作成のヘルプの「サポートされているコネクタ」セクションで接続の詳細を参照してください。フローを構築するためのデータへの接続の詳細については、データへの接続を参照してください。

データのクリーニングと加工

フィールドの類似の値をデータの役割でグループ化する

Tableau Prep Builder のバージョン 2018.2.3 でデータの役割が導入されたことで、フィールド値を標準化し、有効でない値をすばやく見つけることができるようになりました。このリリースでは、データの役割をフィールドに割り当て、そのデータの役割を使用して、データの役割で定義した標準値との値のマッチングやグループ化ができます。データの役割をフィールドに割り当て、[グループ化と置換] メニューから [データの役割の一致] を選択するだけです。その後、この新しいオプションは、無効な値と最も類似する有効な値をスペリングと読み方に基づいてマッチングします。

たとえば、"Saint Martin" や "Saint Maarten" などの国を一覧表示するフィールドがある場合、このフィールドに [国/地域] というデータの役割を割り当てると、新しい [データの役割の一致] オプションを使用してフィールドをグループ化し、これらの値をデータの役割の標準値である "Saint-Martin" にマッピングできます。値の標準的なスペリングがデータ セットにない場合、Tableau Prep Builder は自動的にこの値をグループに追加し、この標準値を使用して一致する値をグループ化します。

この機能は、次のデータの役割に適用され、現在は、米国の英語版でのみサポートされています。

  • 空港
  • 市区町村
  • 国/地域
  • 都道府県/州

データの役割をフィールドに割り当てる方法の詳細については、 データへのデータの役割の割り当てを参照してください。フィールド値をグループ化するためのデータの役割の使用方法の詳細については、グループ化と置換であいまい一致を使用した複数の値の編集を参照してください。

フィールド値のグループ化の際に結果を調整する

[グループ化と置換] クリーニング オプションを使用し、スペリング読み方で類似した値をグループ化する場合に、フィールド上でシンプルなスライダーを使用してグループ化のパラメーターの強さを調整することで、結果をより細かく制御できるようになりました。

5 種類のしきい値の設定から選択して、グループに含める値の数と作成するグループの数を制御することができます。

あいまい一致を使用したフィールドのグループ化の詳細については、同じ値のばらつきのクリーニング (修正)を参照してください。

バージョン 2019.1.3 での追加

データへの接続

表のリレーションシップに基づいてデータをすばやく結合する

Vertica や Microsoft SQL Server など、表のリレーションシップが定義されている表を含むデータベースに接続する場合、 Tableau Prep Builder はこの情報を検出して表示できるようになりました。

たとえば、表内のどのフィールドが一意の識別子で、どのフィールドが関連フィールド (外部キー) かを表示できるようになったほか、これらのフィールドの関連する表の名前も表示できるようになりました

[リンクされているキー] と呼ばれる新しい列が [入力] ペインに表示され、一意の識別子、関連フィールド、または両方の組み合わせであるフィールドの隣にはアイコンが表示されます。

[リンクされているキー] フィールドでは、関連するフィールドまたは組み合わせのフィールドをクリックすると関連する表が表示され、ワンクリックで関連する表のフローへの追加や結合の作成が行われます。

結合を作成すると、Tableau Prep Builder は定義済みのフィールドのリレーションシップを使用して表を結合し、結合句を定義するフィールドのプレビューを表示します。ここから新しい結合ステップをクリックし、必要に応じて結合条件のクリーニングと編集を行うことができます。

関連フィールドを含む表の場合、すべての関連する表のリストを表示し、[フロー] ペインのメニューから結合を作成することもできます。[結合の追加] メニュー オプションでリストより結合する表を選択すると、2 つの表の間のリレーションシップを構成するフィールドに基づき、Tableau Prep Builder により結合が作成されます。

この機能は、表のリレーションシップが定義されているサポートされる任意のデータベース コネクタで使用できます。[リンクされているキー] を使用した表の追加や結合についての詳細は、インプット ステップでのデータの結合を参照してください。

データのクリーニングと加工

ツールバーでのすべてのクリーニングの推奨事項の表示

Tableau Prep Builder によってフィールドに関するクリーニングの推奨事項が検出され提供されると、フィールドの [プロファイル] カードに電球 アイコンが表示されます。選択したステップのツールバーより、任意のフィールドのクリーニングの推奨事項を 1 つの便利なリストにすべて表示できるようになりました。

リスト内のアイテムをクリックするだけで、Tableau Prep Builder がユーザーを、提案された変更を適用可能なフィールドに移動させます。クリーニングの推奨事項の詳細については、推奨事項を使用したクリーニング操作の適用を参照してください。

注: このオプションは、結合ステップ、インプット ステップ、出力ステップ タイプでは利用できません。

その他の機能拡張

フローで特定の変更を見つける

[フロー] ペインのステップで変更アイコンを、または [プロファイル] ペインや [結果] ペインのプロファイル カードをクリックすると、フローに対して行われた特定の変更をすばやく見つけることができるようになりました。探している変更を示すアイコンをクリックし、変更の一覧から注釈を選択するだけです。変更は、[変更内容] ペイン、[プロファイル] ペインまたは [結果] ペイン、該当する場合にはデータ グリッドでハイライトされます。

変更の表示の詳細については、変更内容の表示を参照してください。

最近表示したフローをスタート ページから管理する

フローを保存して Tableau Prep Builder を閉じると、最もよく使用するフローをすばやく見つけることができるよう、フローのサムネイルがスタート ページに保存されます。とはいえ、データ準備を頻繁に使用していると、スタート ページの表示数はすぐに多くなります。必要なフローをすばやく見つけ、フローの操作が完了してもすっきりした状態になるよう、スタート ページにいくつかの新機能を追加しました。

  • フローのサムネイルでグラフィックが強化され、フローをひと目で見つけられるようにフロー レイアウトの表示がさらに正確になりました。

  • グラフィックで十分な情報が得られない場合には、フローのサムネイルにカーソルを合わせると、そのフローの入力と出力の詳細や最後に開いた時期がすぐに表示されます。

  • スタート ページから、最近表示したものの必要でなくなったフローを削除するとすっきりします。このオプションでは、[最近のフロー] ビューからのみフローが削除されますが、フローは削除されません。

バージョン 2019.1.2 での追加

フロー データを最新に維持する

フローを自動的に実行するスケジュールを Tableau Server で設定する

Tableau Server バージョン 2019.1 に新しい Data Management アドオンを追加すると、フローを実行するスケジュールと管理を Tableau Prep Conductor を使用して行うことができます。Tableau Server にフローをパブリッシュしてから、フローを実行してフローの入力や出力を自動的に更新するタスクのスケジュールを設定します。エラーやアラートのオプション、さらに [管理] ビューを使用すると、フロー処理の進捗状況を追跡および管理することができます。

詳細については、フロー データを最新に維持するを参照してください。

ヘルプのデザイン

コンテンツのナビゲーションに役立つ更新が行われ、新しい右クリック メニューが加わりました。これにより、1 つのページ上でさまざまなトピックをすばやく検索し、選択することができます。

バージョン 2019.1.1 での追加

データのクリーニングと加工

行から列へのピボット処理

クロス集計やスプレッドシートでデータを操作する場合、Tableau で簡単に分析できない形式が使用されていることがあります。行に変換する必要のあるデータの列が多くあったり、列は少ないがデータ値に複数の項目が含まれていたりする場合があります。

適切なピボット オプションを選択して、データをこれまで以上に簡単に加工できるようになりました。ピボット ステップで、以下のいずれかのオプションを選択できるようになりました。

  • 列から行: 1 つ以上のフィールドを [ピボットされたフィールド] ペインにドラッグして列から行へピボット処理を実行します。

  • 行から列: フィールドを [ピボットされたフィールド] ペインにドラッグし、フィールド値を使用して新しい列を作成します。次に、これらの列の入力に使用するフィールドにドラッグして集計方法を選択します。

詳細については、データのピボット処理を参照してください。

ワイルドカード検索を使用したフィールドのピボット処理

フィールド数の多いデータ セットがある場合や、フィールドが長期にわたって頻繁に追加または削除されている場合は、列から行へのピボット処理にワイルドカード検索を使用して、ワイルドカード パターン マッチに基づきデータを瞬時にピボット処理することができます。パターンに一致する新規フィールドが追加または削除される場合は、フローの実行時に Tableau Prep Builder でスキーマの変更が検出され、ピボットの結果が自動的に更新されます。

ワイルドカード検索を使用してデータをピボット処理するには、ピボット ステップを追加してから [ここをクリックしてワイルドカード ピボットを作成する] リンクをクリックし、ワイルドカード検索フィールドを開きます。ワイルドカード検索パターンを入力し、入力した値と一致する名前のフィールドを検索します。[検索オプション...] ボタンをクリックして、入力したパターンが含まれるフィールド、またはこのパターンで開始あるいは終了するフィールドを追加するかどうかを選択します。

Enter を押してパターンを適用します。Tableau Prep Builder によりフィールドが自動的にピボット処理されます。

詳細については、データのピボット処理を参照してください。

説明を使用してコンテキストを変更内容に追加する

[変更内容] ペインの変更項目に説明を追加して、クリーニング操作にコンテキストを追加します。[変更内容] ペインを開き、リストの変更項目を右クリックまたは Ctrl を押しながらクリック (Mac) して [説明の追加] を選択します。次に、表示されるテキスト フィールドに説明を入力します。

説明は、変更項目で生成されたテキストの下にコメント アイコンとともに表示されます。

詳細についてはデータのクリーニングと加工を参照してください。

クリーニングの推奨事項を使用して固定幅のテキスト ファイルのデータをすばやく分割する

以前のリリースでは、固定幅のテキスト ファイルや単一列に固定された文字数に制限されたデータ値の文字列が含まれるファイルに格納されたデータを操作する場合に、ファイル上でいくつかのクリーニング前操作を実行するか、複雑な計算を使用して値を複数の列に分割する必要がありました。

このリリースでは、こうしたタイプのデータ ソースに接続する場合にクリーニングの推奨事項機能でこの種の列を検出し、分割オプションを提案してくれるようになりました。データ ソースに接続し、クリーニング ステップを追加します。[プロファイル] ペインで、プロファイル カードの推奨事項アイコンをクリックします。

[適用] をクリックしてフィールドを分割し、結果を確認して新しいフィールドをそれぞれ必要に応じてクリーニングまたは名前変更します。

詳細については、推奨事項を使用したクリーニング操作の適用を参照してください。

バージョン 2018.3.3 での追加

データへの接続

新規ファイル追加時のインプット ユニオンの自動的な更新

インプット ステップで Microsoft Excel やテキスト (.csv) ファイルを検索してユニオンを作成するためにワイルドカード パターンを使用する場合、そのパターンに一致し、同じフォルダーに追加される新しいファイルは、次にフローを開いた際、またはコマンド ラインから実行する際にユニオンに自動的に含められます。

注: パッケージド フロー ファイル (.tflx) では、新しいファイルは既にフローと一緒にパッケージされているため自動的には取得しません。新しいファイルを含めるには、フロー ファイル (.tfl) を開いて新しいファイルを取得してから、フローを再パッケージして新しいファイル データを含めます。

インプット ステップでのファイルのユニオン作成の詳細については、インプット ステップでのファイルおよびデータベース表のユニオン作成を参照してください。

データのクリーニングと加工

クリーニング操作の再利用

データのクリーニングを行う際、フロー全体で何度も同じクリーニング操作やアクションを行うことがよくあります。データのクリーニングや加工をさらに効率的に行えるよう、これらの操作やアクションをフロー全体でコピーして貼り付けする機能が追加されました。これにより、クリーニング操作やアクションを一度に実行し、必要な場合には再利用することができます。

  • フローの別の場所で使用するために 1 つ以上のステップをコピーします。このオプションは、ワイルドカード ユニオンを含むインプット ステップには利用できません。

  • あるステップの [変更内容] ペインで操作をコピーし、別のステップの [変更内容] ペインに貼り付けしてそのステップに同じ操作を適用します。

  • [変更内容] ペインから [プロファイル] ペインのフィールドに操作をドラッグ アンド ドロップし、その操作を別のフィールドに適用します。[変更内容] ペインの操作をコピーし、ステップ内の他のフィールドにドラッグ アンド ドロップしてその操作を複数のフィールドに適用することもできます。このオプションは、計算フィールドなど複数のフィールドに影響する操作には利用できません。

詳細については、データのクリーニングと加工を参照してください。

余分な空白の削除

フィールド値の余分な空白を削除できるよう、簡単な 2 つの新しいクリーニング操作を追加しました。

  • 余分なスペースの削除: テキスト フィールド値でこのオプションを使用すると、先頭と末尾の空白を削除し、文字間の余分な空白を単一スペースで置き換えます。

  • すべてのスペースの削除: このオプションを使用すると、先頭と末尾の空白や文字間の空白を含め、テキスト値にあるすべての空白を削除します。

詳細については、同じ値のばらつきのクリーニング (修正)を参照してください。

データの検証とフィルタリング

フィールドがフロー内のどこで使用されているかを簡単に検索する

フローの作成時に想定されるすべてのフィールド値が表示されていない場合、フィールドが使用されているすべての場所を簡単に追跡でき、フィールドがどこに由来するかも確認できるようになりました。ステップの [プロファイル] ペインまたは [結果] ペインでフィールドを選択するだけで、フロー ペインのステップがハイライトされます。これにより、フィールドが由来するフローのパスが示されるので、以前より簡単にフローのトラブルシューティングを行うことができます。

詳細については、フロー内のフィールドの追跡を参照してください。

その他の機能拡張

一度に Tableau Prep Builder の複数のウィンドウを開く

Windows または Mac で、[ファイル] > [新規] をクリックし、現在作業しているウィンドウを置き換えるのではなくフローの新しいウィンドウを開きます。フロー ファイル (.tfl または .tflx) を開く際、同じウィンドウも開かれるので、複数のフローを同時に操作したり、比較したりすることができます。

インストール後に利用状況レポートをオフにする

Tableau Prep Builder の向上に役立つよう、当社に利用状況パターンのデータを共有することができます。特定のユーザー データを収集することは決してなく、匿名の使用状況データのみを収集します。たとえば、データ ソースの接続タイプ (.csv、sql、Amazon Redshift など)、大きなデータ セットか小さなデータ セットか、フローに含まれる手順の数または使用する操作の種類 (手順の名前や使用する式などのデータ詳細は含まない) などです。

データは機密情報であり、この情報を他社に共有することは決してありません。ただし、インストール後にこのオプションをオフにすることを望まれる場合はそうすることが可能です。[ヘルプ] > [設定とパフォーマンス] に移動し、[使用状況データを共有して Tableau Prep Builder を改善する] をクリックしてチェック マークを外します。詳細については、Tableau Desktop および Tableau Prep Builder 展開ガイドの「利用状況レポート」を参照してください。

バージョン 2018.3.2 での追加

データのクリーニングと加工

クリーニングの推奨事項を使用した迅速なデータ品質の向上

データの問題を迅速に発見して修正できるよう、Tableau Prep ではデータ フィールドを調べ、問題を修正するために行える変更を提案できるようになりました。Tableau Prep はデータ フィールドを調べ、推奨される変更が識別されると、電球アイコンがフィールドの [プロファイル] カードに表示されます。

推奨される変更を表示するには電球アイコンをクリックし、[推奨事項] カードにカーソルを合わせてから [適用] をクリックすると、それがフィールドに自動的に適用されます。変更は [変更内容] ペインに記録されますが、いつでも削除可能です。

以下の例では、Tableau Prep がフィールド値を URL と識別しており、有効でない値を識別するためにフィールドにデータの役割を適用することを推奨しています。

この機能は、インプット、出力、結合のステップ タイプを除くすべてのステップ タイプで利用可能です。今回のリリースでは、推奨タイプには以下が含まれます。

  • データの役割
  • フィルター
  • 無効な値の Null 値での置換
  • フィールドの削除
  • スペースのトリミング

詳細については、推奨事項を使用したクリーニング操作の適用を参照してください。

その他の機能拡張

コマンド ラインからのフロー実行時の柔軟性追加

コマンド ラインからフローを実行しており、データベースに接続する、または出力ファイルをサーバーにパブリッシュする場合、必要なすべての認証資格情報を含む、認証資格情報の .json ファイルが必要です。過去のリリースでは、データベースに接続するのみ、またはフローの出力をサーバーにパブリッシュするのみの場合、空白の配列を認証資格情報の .json ファイルに含めないと、プロセスが失敗していました。

今後、認証資格情報の .json ファイルに空白の配列を含める必要はなくなりました。たとえば、データベースに接続するのみの場合、outputConnection 配列を .json ファイルに含める必要はありません。

コマンド ラインからのフロー実行の詳細については、コマンドラインから出力ファイルを更新を参照してください。

パフォーマンスの向上

フローの操作が迅速かつ効率的になるように、以下の強化が適用されました。

  • 製品のシャットダウンにより、Tableau Prep が使用していたメモリ容量がすぐに返されます。

  • 予期しないエラーが表示される場合には、アクションやプロセスを再試行し、フロー内にユーザーが留まれるようになりました。

  • 処理時間を短縮するために、データの読み込みまたはフロー内のデータの確認を行っているときのパフォーマンスが向上しました。

  • 以下のコネクタに接続する場合、スキーマを迅速に見つけるために検索フィールドを使用できるようになりました。
    • Amazon EMR Hadoop Hive
    • Cloudera Hadoop
    • Hortonworks Hadoop Hive
    • MapR Hadoop Hive
    • Presto
    • Spark SQL

以前のバージョンでの追加

バージョン 2018.3.1 での追加

Tableau Prep のインストールと展開

既定のリポジトリ場所を変更する

既定では、Tableau Prep のインストール時に、マイ Tableau Prep リポジトリはコンピューターの Documents フォルダーに自動的にインストールされます。しかし、フローやデータ ソースを保存できる場所に関して制限がある場合は、Tableau Prep のインストール後にマイ Tableau リポジトリを別のディレクトリに移動することができます。

ディレクトリを移動するには、Tableau Prep を開き、トップ メニューから [ファイル] > [リポジトリの場所] を選択します。リポジトリを移動するフォルダーを選択します。

詳細については、Tableau Desktop および Tableau Prep 導入ガイドの「マイ Tableau Prep リポジトリの場所の変更 (英語)」を参照してください。

データへの接続

PDF ファイルに保存されているデータをクリーニングする

PDF ファイルに保存されているデータの分析は簡単に処理できない可能性があります。今後は、Tableau Prep で PDF ファイルに直接接続してデータをクリーニングすることができます。

PDF ファイル内のデータへの接続方法の詳細については、Tableau Desktop ヘルプの「PDF ファイル」を参照してください。

: データ コネクタには後方互換性がありません。これらのコネクタを含むフローは以前のバージョンの Tableau Prep で開けますが、データ接続を削除しない限りエラーが発生したり実行できなかったりします。

データベース表用のワイルドカード ユニオン

単一データ ソースに保存されているデータベース表を操作する場合、今後はインプット ステップでワイルドカード検索を使用して表をユニオンすることができます。その後、インプット ステップで複数のファイルをユニオンするのに使用するのと同じプロセスを使用して、インプット ステップで選択した表のデータをすべて含めることができます。

このタイプのユニオンを使用するには、表が同じデータ ソースにある必要があります。また、ワイルドカード ユニオンがサポートされているデータ ソースに接続する必要があります。

次のデータ ソースでこのタイプのユニオンがサポートされています。

  • Amazon Redshift

  • Microsoft SQL Server

  • MySQL

  • Oracle

  • PostgreSQL

詳細については、インプット ステップでのファイルおよびデータベース表のユニオン作成を参照してください。

データのクリーニングと加工

フィールド値を NULL で置換する

データ行を分析に含める場合、その中にある特定のフィールド値を除外するには、そのフィールド値を NULL 値に変更することができます。置換するフィールド値を選択した後、選択した値を右クリック (Mac では Control を押しながらクリック) してメニューから [NULL で置換する] を選択します。

フィールド値の置換の詳細については、同じ値のばらつきのクリーニング (修正)を参照してください。

任意のステップでクリーニング操作を適用する

フロー内の問題をより効率的に修正できるようになりました。今後は、結合、ユニオン、ピボット、集計の際にデータで問題を検出した場合、追加のクリーニング ステップを追加する必要はなく、その問題を当該のステップで直接修正することができます。

操作の順序が重要であるため、クリーニング操作はその結合、ユニオン、ピボット、または集計の前または後に配置され、その情報は当該のステップの [変更内容] ペインで追跡できます。

また、その変更に関する注釈がフロー ペインでそのステップに追加されます。インプット ステップの場合は、注釈がそのステップの左に表示されるとともにインプット フィールド リストに追加されるため、変更が適用されたフィールドを容易に知ることができます。他のすべてのタイプのステップの場合、注釈はフロー ペインでそのステップの上に表示されます。

一部のクリーニング操作は引き続きクリーニング ステップで実行する必要があり、インプット ステップおよび出力ステップでのみ使用できるクリーニング操作もあります。下の表は各タイプのステップで使用できるクリーニング操作を示しています。

  インプット クリーニング 集計 ピボット処理 結合 ユニオン 出力
フィルター X X X X X X  
グループ化と置換   X X X X X  
クリーニング   X X X X X  
値の分割   X X X X X  
フィールド名の変更 X X X X X X  
値の編集   X X X X X  
データ型の変更 X X X X X X  
計算フィールドの作成   X X X X X  
フィールドの削除 X X X X X X  

詳細については、クリーニング操作の適用を参照してください。

バージョン 2018.2.3 での追加

データへの接続

MongoDB Business Intelligence (BI) に保管されているデータに接続

Mongo DB Business Intelligence にデータを保管すると、Tableau Prep でこのデータに接続してクリーニングできます。

Mongo DB Business Intelligence を使用するデータへの接続方法の詳細については、Tableau Desktop ヘルプの「MongoDB BI コネクタ」を参照してください。

: データコネクタには後方互換性がありません。これらのコネクタを含むフローは以前のバージョンの Tableau Prep で開けますが、データ接続を削除しない限りエラーが発生したり実行できなかったりします。

データの検証とフィルタリング

データの役割をフィールド値に指定

データの役割をフィールド値に割り当てて、Tableau Prep でデータ セットの不一致や外れ値を検索できるようになりました。

データの役割は、メール アドレスや地理的役割 (市区町村や郵便番号) など、フィールド値の意味や値が示す内容を Tableau Prep に伝えるためのものです。フィールドにデータの役割が割り当てられると、Tableau Prep はこのフィールド値を検証して一致しない値にフラグを立てるため、さらに詳しく検討することができます。

有効またはそうでない値のみを表示するには、ドロップダウン メニューから、新しいフィルター オプションを使用します。

今回のリリースでは、以下のデータの役割がサポートされています。

  • メール

  • URL

  • 地理的役割 (現在の地理的データに基づく、Tableau Desktop で使用されるのと同じデータ)

    • 空港
    • 市外局番 (米国)
    • コアベース統計地域/大都市統計地域
    • 市区町村
    • 下院議員選挙区 (米国)
    • 国/地域
    • 欧州地域統計分類単位
    • 都道府県/州
    • 郵便番号

詳細については、データへのデータの役割の割り当てを参照してください。

データの結合またはユニオン

不一致のフィールドを結合句で直接修正

2 つのデータ表の結合では、互いのフィールドの値は同一でも、データ入力エラーのためにフィールドが不一致になる場合がしばしばあります。Tableau Prep では、不一致のフィールド値を赤色で表示することで、不一致を結合句で特定することができます。しかし、このフィールド値を結合句で直接修正できればさらに良いと思いませんか? 今回のリリースではこの機能が追加されています。

2 つのデータ セットを結合する際、結合するフィールド値を編集し、結合句内で修正することができるようになりました。フィールド値をダブルクリックするだけで編集できます。

フィールドを選択して インラインでの編集に変更

データ セットを適切に結合するために、以前のフローのクリーニング ステップにクリーニングのアクションが自動的に戻されます。

結合ステップの前にクリーニング ステップはないのでしょうか? 大丈夫です。Tableau Prep では、クリーニング操作をキャプチャするステップが自動的に結合で追加されます。

フィールド値を結合句で直接クリーニングする方法の詳細については、データの結合またはユニオンを参照してください。

バージョン 2018.2.2 での追加

Tableau Prep のインストールと展開

表示言語の設定

Tableau Prep を起動する際、ユーザーのコンピューターに設定されているロケールを検知し、適切な言語でユーザーインターフェイス、日付、数値形式を表示できるようになりました。サポートされている言語をトップメニューの [ヘルプ] > [言語選択] で選択すれば、ユーザーインターフェイスの表示言語を変更できます。

詳細については、Tableau Desktop および Tableau Prep 導入ガイドの「表示言語の設定」を参照してください。

データへの接続

Microsoft Access に保存されているデータに接続

Microsoft Access を使ってデータの入力やデータ表の保存を行っている場合、ファイル ブラウザを使ってアクセス ファイルに接続 (バージョン 2007 以降) し、データをクリーニングできるようになりました。

このコネクタでは 64 ビット ドライバーが必要になります。

Tableau Prep をデータに接続する詳細な方法については、Tableau Desktop ヘルプの「Access」を参照してください。

: データコネクタには後方互換性がありません。これらのコネクタを含むフローは以前のバージョンの Tableau Prep で開けますが、データ接続を削除しない限りエラーが発生したり実行できなかったりします。

データのクリーニングと加工

フローの各ステップのカラースキーマを変更

フローを構築する際にデータに加えた変更を追跡しやすくするために、Tableau Prep は初期状態でフローの各ステップに対して単一の色を割り当てます。しかし、このカラースキーマを任意で変更できます。

カラーパレットから色を選択し、1 つまたは複数のステップのカラースキーマを変更できるようになっています。変更したいステップを [フロー] ペインで選択し、選択したステップを右クリックし、さらにコンテキストメニューで [ステップの色を編集] を選ぶだけです。

見た目が気になりますか?トップメニューで [元に戻す] をクリックするか、カラーパレット メニューで [ステップの色をリセット] を選択します。

詳細については、フローの構築を参照してください。

各ステップに説明を追加

フローを他の人と共有する際、変更の内容や理由を伝えるのがわずらわしくなることもあります。フローの各ステップに短い説明を追加できるようになったため、作業をスムーズに進めることができます。この説明は右側のフローペインに表示されます。

フローの各ステップに説明を追加する詳細な方法については、フローの構築を参照してください。

あいまい一致を使用してスペルミスを発見・修正

スペルミスにより同じ値にばらつきがある際、それを素早く特定して整理できるよう、あいまい一致のクリーニング機能という別のオプションを追加しました。新しいスペリング オプションを使えば、文字が余分にあったり不足していたりする差分を持つテキストの値を見つけてグループ化することができます。このオプションは、サポートされているすべての言語で機能します。

スペリング オプションはレーベンシュタイン距離アルゴリズムを利用して 2 つのテキストの値の編集距離を計算してから、編集距離が既定のしきい値より小さい場合にそれらをグループ化します。

詳細については、同じ値のばらつきのクリーニング (修正)を参照してください。

作業の保存と共有

コマンドラインからフローを実行

Tableau Prep でデータを最新に保つために、フローを実行することになります。しかし、フローを実行したい時に毎回 Tableau Prep を開くのは時間がかかります。このプロセスを合理化するために、Tableau Prep を開かずにコマンドラインからフローを実行できるようになりました。

コマンドラインからフローを実行するためには、次のものが必要になります。

  • 実行したいフロー (.tfl) ファイルのパス。

  • フローが入力ステップで接続するデータベースの認証資格情報、および出力がパブリッシュされるサーバーの認証資格情報を含む .json ファイル。

    フローが入力または出力で接続したりパブリッシュしたりするのがローカル ファイルやネットワーク共有上のファイルの場合は、このファイルは必要ありません。

    : ネットワーク共有上に保管されているファイルに接続またはパブリッシュする場合、パスワード保護はサポートされません。

  • フローを実行するマシンの管理者パーミッション。

このオプションは、Windows マシン (タスク スケジューラ対応) と Mac マシンのどちらでも利用できます。このプロセスを使用するには、ライセンス認証された Tableau Prep バージョンが必要で、Prep がインストールされたマシンでプロセスを実行する必要があります。

コマンドラインからフローを実行する方法については、コマンドラインから出力ファイルを更新を参照してください。

バージョン 2018.2.1 での追加

Tableau Prep のインストールと展開

コマンド ラインから Tableau Prep のライセンス認証を解除

Tableau Prep をコンピューター上に置いておく必要がなくなったら、Tableau Desktop の場合と同じように -return オプションを使ってコマンド ラインからライセンス認証を解除できるようになりました。

詳細については、「プロダクト キーのライセンス認証を解除」を参照してください。Tableau Prep でコマンドラインから利用できる他のインストーラーのプロパティの詳細については、「インストーラー オプション」と「Tableau Desktop の導入」の関連セクションを参照してください。

仮想デスクトップ サポートを使用して Tableau Prep のインストールを最適化

Tableau Desktop の場合と同様に、仮想デスクトップ サポートの設定を行い、非永続的な仮想デスクトップや定期的にイメージをとるコンピューターで使用する Tableau Desktop のインストールを最適化できるようになりました。仮想デスクトップ サポートを使えば、Tableau がホストする「Authorization to Run」(ATR) サービスを使って事前に指定した期間が過ぎた後に自動的に Tableau Prep のライセンス認証を解除できるため、プロダクト キーのライセンス認証を手動で解除する手間が省けます。

このオプションを設定する詳細な方法については、Tableau Desktop および Tableau Prep の導入ガイドにある「仮想デスクトップ サポートの設定」を参照してください。

データへの接続

クラウドデータ ソースおよび Hadoop Hive に接続

クラウドデータや Hadoop に保存されているデータに接続できるよう、次のコネクタのサポートを追加しました。

  • Snowflake

  • Amazon EMR Hadoop Hive

  • Cloudera Hadoop (Hive および Impala)

  • Hortonworks Hadoop Hive

  • MapR Hadoop Hive

  • Apache Drill

  • SparkSQL

Tableau Prep をデータに接続する詳細な方法については、Tableau Desktop ヘルプの「サポートされているコネクタ」のところで、お使いのコネクタのトピックを参照してください。

これらのデータ コネクタには下位互換性がありません。これらのコネクタを含むフローは以前のバージョンの Tableau Prep で開けますが、データ接続を削除しない限りエラーが発生したり実行できなかったりします。

データの探索

必要なデータのみ保持するための新しいフィルターオプション

Null 値を保持・除外する際やテキスト値に対するワイルドカード一致を設定する際に、複雑な計算式を記述する必要がなくなりました。まずは計算式を記述し、適切な結果が得られなかったら変更を元に戻すという作業を行うことなく、任意のフィールドに対して新しいフィルターオプションのいずれかを選択するだけで、変更による影響を即座に確認できるようになっています。

詳細については、値のフィルターを参照してください。

データのクリーニングと加工

計算フィールドで ISO-8601 の日付規格を使用

グレゴリオ暦をサポートするために計算フィールドを作るのが簡単になりました。次の日付の構成要素において、Tableau Prep が ISO-8601 国際日付規格をサポートするようになりました。

  • "iso-year"

  • "iso-quarter"

  • "iso-week"

  • "iso-weekday"

これらの日付の構成要素は DATEPART、DATETRUNC、DATENAME、DATEDIFF、および DATEADD 関数で使用します。

たとえば Week Number = STR(DATEPART('iso-year', [Week Date])) + "-" + STR(DATEPART('iso-week', [Week Date])) です

計算フィールドで日付関数を使用する詳細な方法については、Tableau Desktop ヘルプの「日付関数」を参照してください。

データグリッドにクリーニング操作を適用

以前のバージョンではデータのプレビューがデータグリッドによって表示されましたが、クリーニングのオプションはほとんど利用できませんでした。今後はどこからでもデータを操作できるようになります。データグリッドで詳細な値を操作したり、プロファイルペインを折りたたんだり、プロファイルペインで利用できるものと同じクリーニング操作をデータグリッドで行えます。

詳細については、データのクリーニングと加工を参照してください。

プロファイルペインで値を複数選択してグループ化

プロファイル カードで複数の値を選択してから右クリックしてメニューを開き、[グループ化] を選択することで、単一のフィールドの一連の値を素早くグループ化できるようになりました。右クリックしてメニューを開く際、選択したフィールド値のもとで値がグループ化されます。グループ化された値の隣にクリップのアイコンが表示されます。

グループ化された値を右クリックすると再びメニューが開き、値のグループ化を解除したり、値を編集したりできます。

値のグループ化の詳細については、同じ値のばらつきのクリーニング (修正)を参照してください。

その他の機能拡張

操作性を向上させるため、以下の機能拡張も行いました。

  • フローにステップを追加する際にメニュー上に新たなアイコンが表示され、見た目に分かりやすくなるとともに、Tableau Prep の視覚的言語を理解しやすくなります。

  • また、プロファイルペインにアニメーションが加わり、変更による影響を視覚的に把握しやすくなっています。

     

データの結合またはユニオン

ユニオンの推奨事項を使用して一致しないフィールドをクリーニング

複数のファイルにユニオンを実行した後、一致しないフィールドを修正しやすくなりました。[ユニオンのサマリー] ペインに追加された [一致しないフィールド] セクションに、一致しないフィールドとそのデータ ソースが一覧表示されます。次のオプションのいずれかを使用し、このセクションで一致しないフィールドを直接マージすることができます。

  • リストから単一のフィールドを選択します。データ型、フィールド名の類似性に基づいて Tableau Prep が同様の特性を持つと判断したフィールドが黄色くハイライト表示されるため、一致したことが分かります。一致したとして提案されたフィールドにカーソルを合わせるとプラス ボタンが表示され、クリックすれば 2 つのフィールドをマージできます。

  • リストで複数のフィールドを選択し、いずれかを右クリックして [フィールドのマージ] を選択します。

    データのユニオン、および一致しないフィールドを解決する詳細な方法については、データのユニオン作成 を参照してください。

一致しないフィールドをすべての結合タイプについて特定

どのような方法でテーブルを結合しても、一致しないフィールドを簡単に識別できるようになりました。以前のバージョンでは [結合句] の表に、単一のフィールドが別のフィールドと同じである場合にのみ除外されるフィールド値が表示されていました。しかし今後は、結合句で一致させる際に、"End Date >= Modified Date" のようにどの演算子を使う場合でも、このデータが表示されます。

詳細については、データの結合を参照してください。

バージョン 2018.1.2 での追加

Tableau Prep のインストールと展開

コマンド ラインからの Tableau Prep のライセンス認証と登録 (Windows)

Tableau Desktop と同様、コマンド ラインを以下のプロパティと一緒に含めることにより、コマンド ラインから Tableau Prep をライセンス認証して登録できるようになりました:

  • ACTIVATE_KEY="<key>"。インストーラーで -activate を実行してプロダクト キーを適用します。

  • REGISTER=“1”。インストール プロセスの際、インストーラーは -register プロセスを実行し、登録情報を追加します。

これらのインストーラーのプロパティや、コマンド ラインから Tableau Prep のライセンス認証と登録を行う方法の詳細については、「インストーラー オプション」と「Tableau Desktop の配置」の関連セクションを参照してください。

データへの接続

統計ファイルまたは Presto に保存されているデータへの接続

さらに多くの場所のデータに接続するのに役立つ新しいコネクタを 2 つ追加しました。

  • 統計ファイル。SAS (*.sas7bdat)、SPSS (*.sav)、および R (*.rdata) データ ファイルに接続します。

  • Presto。Presto への接続の構成方法の詳細については、Tableau Desktop ヘルプの「Presto」を参照してください。

これらのデータ コネクタには下位互換性がありません。これらのコネクタを含むフローは以前のバージョンの Tableau Prep で開きますが、データ接続を削除しない限りエラーが発生したり実行できなかったりします。

インプット ステップで Data Interpreter が見つけたサブテーブルでのユニオン作成

Data Interpreter を使用して Microsoft Excel データをクリーニングしており、これから結果のサブテーブルのユニオンを作成したいと考えていますか。ワイルドカード ユニオンを使用し、インプット ステップで見つかったすべてのサブテーブルのユニオンを作成できるようになりました。

サブテーブルのいずれかを [フロー] ペインにドラッグしてから、ワイルドカード検索条件を使用してデータのユニオンを作成する残りのサブテーブルを選択し、インプット ステップにすべてのサブテーブルのデータを含めるだけです。

詳細については、インプット ステップでのファイルおよびデータベース表のユニオン作成を参照してください。

テーブルを読み込んでいる場合のより良いフィードバック

初めてデータベースに接続する場合、何も起こらなかったように見えることがあります。新しいインジケーターにより、データが読み込み中であることが分かるようになりました。

データの探索

プロファイル ペインとデータ グリッドでのフィールドの並べ替え

ドラッグ アンド ドロップにより [プロファイル] ペインと [データ] グリッドの両方でフィールドを並べ替えできるようになり、2 つのペインの同期状態は維持されます。また、フィールド名を変更してもフィールドの順序は維持されます。フィールドの並べ替えは自動で行われなくなります。

データのクリーニングと加工

ドラッグと選択によるフローの複数ステップの削除

フローのセクション全体を簡単に削除できるようになりました。[フロー] ペインをクリックし、削除するフローのセクションをマウスでドラッグして選択できるようになりました。その後、右クリックし、選択したすべてのステップを一度に削除してください。詳細については、フローの構築を参照してください。

フィールドの複数グループに対する単一アクションでのピボット処理

Tableau Prep のピボット オプションが、さらに複雑なスプレッドシートやテキスト ファイルを十分にサポートするように拡張されました。単一ピボット処理を実行するか、ピボット処理するフィールドのグループを選択できるようになりました。

たとえば、スプレッドシートをピボット処理し、月および年別に売上、税額、合計を表示するには、フィールドの各グループのピボット処理を行い、必要な結果を得ることができます。詳細については、データのピボット処理を参照してください。

元のスプレッドシート フィールドの複数グループに対するピボット処理後

フィールドをマージする際のフィールド命名の向上

フィールドをマージする場合、フィールド名が連結されなくなりました。代わりに、ターゲット フィールドのフィールド名が維持されます。詳細については、フィールドのマージを参照してください。

連結されたフィールドの命名 簡素化されたフィールドの命名

その他の機能拡張

有用性とパフォーマンスを向上させるため、以下の機能拡張も行いました。

  • 新しい編集アイコンが [変更内容] ペインのエントリーにカーソルを合わせると表示され、どのアイテムが編集可能かを迅速に確認するのに役立ちます。

  • ステップ名を変更してもフローが自動的に実行されなくなったため、作成エクスペリエンスはシームレスです。

  • 複数のシートを含む Microsoft Excel ファイルに接続する場合、[接続] ペインが自動的に開き、データを迅速に取得するのに役立ちます。

 

ご意見をお寄せくださりありがとうございます。 ご意見の送信中にエラーが発生しました。もう一度実行するか、当社にメッセージを送信してください