Tableau Prep で Amazon Athena のデータ にリアルタイム接続してビジュアライズする方法
Tableau は、企業がデータを活用して課題を解決する方法を変革するビジュアル分析プラットフォームです。CData Tableau Connector for Amazon Athena と組み合わせることで、Tableau Prep からAmazon Athena のデータに簡単にアクセスできるようになります。この記事では、Tableau Prep で Amazon Athena に接続し、シンプルなチャートを作成する方法をご紹介します。
CData Tableau Connector を使用すると、Tableau からAmazon Athena のデータに高速でアクセスできます。コネクタをインストールしたら、Amazon Athena で認証するだけで、レスポンシブで動的なビジュアライゼーションとダッシュボードの構築をすぐに開始できます。CData Tableau Connector は、ネイティブの Tableau データ型でAmazon Athena のデータを提供し、複雑なフィルタ、集計などの操作を自動的に処理することで、Amazon Athena のデータ へのシームレスなアクセスを実現します。
NOTE:CData Tableau Connector は、Tableau Prep Builder 2020.4.1 以降をサポートしています。それ以前のバージョンの Tableau Prep Builder をご使用の場合は、CData JDBC Driver をご利用ください。 Tableau Cloud でAmazon Athena のデータに接続したい場合は、CData Connect AI をご利用ください。
Amazon Athena データ連携について
CData は、Amazon Athena のライブデータにアクセスし、統合するための最も簡単な方法を提供します。お客様は CData の接続機能を以下の目的で使用しています:
- IAM 認証情報、アクセスキー、インスタンスプロファイルなど、さまざまな方法で安全に認証できます。多様なセキュリティニーズに対応し、認証プロセスを簡素化します。
- 詳細なエラーメッセージにより、セットアップを効率化し、問題を迅速に解決できます。
- サーバーサイドでのクエリ実行により、パフォーマンスを向上させ、クライアントリソースへの負荷を最小限に抑えます。
ユーザーは、Tableau、Power BI、Excel などの分析ツールと Athena を統合し、お気に入りのツールから詳細な分析を行うことができます。
CData を使用した Amazon Athena のユニークなユースケースについては、ブログ記事をご覧ください:https://jp.cdata.com/blog/amazon-athena-use-cases
はじめに
CData Tableau Connector のインストール
CData Tableau Connector for Amazon Athena をインストールすると、インストーラが TACO ファイルと JAR ファイルを適切なディレクトリにコピーします。以下の接続手順でデータソースが表示されない場合は、2つのファイルをコピーする必要があります:
- コネクタのインストール先(Windows では C:\Program Files\CData\CData Tableau Connector for Amazon Athena 20XX\lib)にある lib フォルダ内の TACO ファイル(cdata.amazonathena.taco)を、Tableau Prep Builder リポジトリにコピーします:
- Windows:C:\Users\[Windows ユーザー]\Documents\My Tableau Prep Repository\Connectors
- MacOS:/Users//Documents/My Tableau Prep Repository/Connectors
- 同じ lib フォルダ内の JAR ファイル(cdata.tableau.amazonathena.jar)を、Tableau のドライバーディレクトリ(通常 [Tableau のインストール先]\Drivers)にコピーします。
Tableau Prep Builder で Amazon Athena に接続する
Tableau Prep Builder を開き、「データに接続」をクリックして「Amazon Athena by CData」を検索します。接続を設定し、「サインイン」をクリックします。
Amazon Athena 接続プロパティの取得・設定方法
それでは、早速Athena に接続していきましょう。
データに接続するには、以下の接続パラメータを指定します。
- DataSource:接続するAmazon Athena データソース。
- Database:接続するAmazon Athena データベース。
- AWSRegion:Amazon Athena データがホストされているリージョン。
- S3StagingDirectory:クエリの結果を保存するS3 フォルダ。
Database またはDataSource が設定されていない場合、CData 製品はAmazon Athena の利用可能なデータソースからすべてのデータベースのリスト化を試みます。そのため、両方のプロパティを設定することでCData 製品のパフォーマンスが向上します。
Amazon Athena の認証設定
CData 製品は幅広い認証オプションに対応しています。詳しくはヘルプドキュメントの「はじめに」を参照してみてください。
AWS キーを取得
IAM ユーザーの認証情報を取得するには、以下のステップお試しください。
- IAM コンソールにサインインします。
- ナビゲーションペインでユーザーを選択します。
- ユーザーのアクセスキーを作成または管理するには、ユーザーを選択してからセキュリティ認証情報タブに移動します。
AWS ルートアカウントの資格情報を取得するには、以下のステップをお試しください。
- ルートアカウントの認証情報を使用してAWS 管理コンソールにサインインします。
- アカウント名または番号を選択します。
- 表示されたメニューでMy Security Credentials を選択します。
- ルートアカウントのアクセスキーを管理または作成するには、Continue to Security Credentials をクリックし、[Access Keys]セクションを展開します。
その他の認証オプションについては、ヘルプドキュメントの「Amazon Athena への認証」を参照してください。
データの探索と準備
操作したいテーブルとビューをキャンバスにドラッグします。複数のテーブルを含めることができます。
データのクレンジングとフィルタリング
データをさらに準備するために、フィルタの適用、重複の削除、カラムの変更などを行うことができます。
- まず、テーブルの横にあるプラス をクリックし、「クリーンステップ」オプションを選択します。
- フィルタするフィールド値を選択します。値を選択すると、その選択が他のフィールドにどのように影響するかを確認できます。
- 選択した値を持つエントリを「保持のみ」または「除外」を選ぶと、それに応じてデータが変更されます。
データの結合とユニオン
データ結合とは、共通のフィールドまたはキーに基づいて、2つ以上の関連テーブルからデータを組み合わせることです。
- 複数のテーブルを結合するには、関連テーブルをキャンバス上の既存のテーブルの横にドラッグし、結合ボックスに配置します。
- 両方のテーブルに存在する外部キーを選択します。
準備したデータのエクスポート
クレンジング、フィルタリング、変換、結合を行った後、Tableau でビジュアライズするためにデータをエクスポートできます。
- その他必要な変換を追加し、フローの最後に出力ノードを挿入します。
- 選択した形式でファイルに保存するようにノードを設定します。
出力データが保存されたら、他のファイルソースと同様に Tableau で操作できます。
CData Tableau Connector for Amazon Athena と Tableau Prep Builder を使用すると、Amazon Athena のデータ の結合、クレンジング、フィルタリング、集計を簡単に行い、Tableau でビジュアライゼーションやレポートを作成できます。30日間の無料トライアルをダウンロードして、今すぐ始めましょう。