Tableau Prep で Azure Data Lake Storage のデータ にリアルタイム接続してビジュアライズする方法
Tableau は、企業がデータを活用して課題を解決する方法を変革するビジュアル分析プラットフォームです。CData Tableau Connector for Azure Data Lake Storage と組み合わせることで、Tableau Prep からAzure Data Lake Storage のデータに簡単にアクセスできるようになります。この記事では、Tableau Prep で Azure Data Lake Storage に接続し、シンプルなチャートを作成する方法をご紹介します。
CData Tableau Connector を使用すると、Tableau からAzure Data Lake Storage のデータに高速でアクセスできます。コネクタをインストールしたら、Azure Data Lake Storage で認証するだけで、レスポンシブで動的なビジュアライゼーションとダッシュボードの構築をすぐに開始できます。CData Tableau Connector は、ネイティブの Tableau データ型でAzure Data Lake Storage のデータを提供し、複雑なフィルタ、集計などの操作を自動的に処理することで、Azure Data Lake Storage のデータ へのシームレスなアクセスを実現します。
NOTE:CData Tableau Connector は、Tableau Prep Builder 2020.4.1 以降をサポートしています。それ以前のバージョンの Tableau Prep Builder をご使用の場合は、CData JDBC Driver をご利用ください。 Tableau Cloud でAzure Data Lake Storage のデータに接続したい場合は、CData Connect AI をご利用ください。
CData Tableau Connector のインストール
CData Tableau Connector for Azure Data Lake Storage をインストールすると、インストーラが TACO ファイルと JAR ファイルを適切なディレクトリにコピーします。以下の接続手順でデータソースが表示されない場合は、2つのファイルをコピーする必要があります:
- コネクタのインストール先(Windows では C:\Program Files\CData\CData Tableau Connector for Azure Data Lake Storage 20XX\lib)にある lib フォルダ内の TACO ファイル(cdata.adls.taco)を、Tableau Prep Builder リポジトリにコピーします:
- Windows:C:\Users\[Windows ユーザー]\Documents\My Tableau Prep Repository\Connectors
- MacOS:/Users//Documents/My Tableau Prep Repository/Connectors
- 同じ lib フォルダ内の JAR ファイル(cdata.tableau.adls.jar)を、Tableau のドライバーディレクトリ(通常 [Tableau のインストール先]\Drivers)にコピーします。
Tableau Prep Builder で Azure Data Lake Storage に接続する
Tableau Prep Builder を開き、「データに接続」をクリックして「Azure Data Lake Storage by CData」を検索します。接続を設定し、「サインイン」をクリックします。
Azure Data Lake Storage 接続プロパティの取得・設定方法
Azure Data Lake Storage Gen2 への接続
それでは、Gen2 Data Lake Storage アカウントに接続していきましょう。接続するには、以下のプロパティを設定します。
- Account:ストレージアカウントの名前
- FileSystem:このアカウントに使用されるファイルシステム名。例えば、Azure Blob コンテナの名前
- Directory(オプション):レプリケートされたファイルが保存される場所へのパス。パスが指定されない場合、ファイルはルートディレクトリに保存されます
Azure Data Lake Storage Gen2への認証
続いて、認証方法を設定しましょう。CData 製品では、5つの認証方法をサポートしています:アクセスキー(AccessKey)の使用、共有アクセス署名(SAS)の使用、Azure Active Directory OAuth(AzureAD)経由、Azure サービスプリンシパル(AzureServicePrincipal またはAzureServicePrincipalCert)経由、およびManaged Service Identity(AzureMSI)経由です。
アクセスキー
アクセスキーを使用して接続するには、まずADLS Gen2ストレージアカウントで利用可能なアクセスキーを取得する必要があります。
Azure ポータルでの手順は以下のとおりです:
- ADLS Gen2ストレージアカウントにアクセスします
- 設定でアクセスキーを選択します
- 利用可能なアクセスキーの1つの値をAccessKey 接続プロパティにコピーします
接続の準備ができたら、以下のプロパティを設定してください。
- AuthScheme:AccessKey
- AccessKey:先ほどAzure ポータルで取得したアクセスキーの値
共有アクセス署名(SAS)
共有アクセス署名を使用して接続するには、まずAzure Storage Explorer ツールを使用して署名を生成する必要があります。
接続の準備ができたら、以下のプロパティを設定してください。
- AuthScheme:SAS
- SharedAccessSignature:先ほど生成した共有アクセス署名の値
その他の認証方法については、 href="/kb/help/" target="_blank">ヘルプドキュメントの「Azure Data Lake Storage Gen2への認証」セクションをご確認ください。
データの探索と準備
操作したいテーブルとビューをキャンバスにドラッグします。複数のテーブルを含めることができます。
データのクレンジングとフィルタリング
データをさらに準備するために、フィルタの適用、重複の削除、カラムの変更などを行うことができます。
- まず、テーブルの横にあるプラス をクリックし、「クリーンステップ」オプションを選択します。
- フィルタするフィールド値を選択します。値を選択すると、その選択が他のフィールドにどのように影響するかを確認できます。
- 選択した値を持つエントリを「保持のみ」または「除外」を選ぶと、それに応じてデータが変更されます。
データの結合とユニオン
データ結合とは、共通のフィールドまたはキーに基づいて、2つ以上の関連テーブルからデータを組み合わせることです。
- 複数のテーブルを結合するには、関連テーブルをキャンバス上の既存のテーブルの横にドラッグし、結合ボックスに配置します。
- 両方のテーブルに存在する外部キーを選択します。
準備したデータのエクスポート
クレンジング、フィルタリング、変換、結合を行った後、Tableau でビジュアライズするためにデータをエクスポートできます。
- その他必要な変換を追加し、フローの最後に出力ノードを挿入します。
- 選択した形式でファイルに保存するようにノードを設定します。
出力データが保存されたら、他のファイルソースと同様に Tableau で操作できます。
CData Tableau Connector for Azure Data Lake Storage と Tableau Prep Builder を使用すると、Azure Data Lake Storage のデータ の結合、クレンジング、フィルタリング、集計を簡単に行い、Tableau でビジュアライゼーションやレポートを作成できます。30日間の無料トライアルをダウンロードして、今すぐ始めましょう。