Clear Analytics でAmazon Athena のデータを使ってチャートを作成
CData ODBC ドライバー for Amazon Athena は、ODBC 標準を介してAmazon Athena のライブデータへのアクセスを可能にし、さまざまな BI、レポート、ETL ツールでAmazon Athena のデータ を直接扱うことができます。この記事では、Microsoft Excel のアドインである Clear Analytics を使って、Amazon Athena に ODBC データソースとして接続し、Amazon Athena のデータ を基にしたクエリ、テーブル、チャート(PivotTable を含む)を作成する方法を説明します。
Amazon Athena データ連携について
CData は、Amazon Athena のライブデータにアクセスし、統合するための最も簡単な方法を提供します。お客様は CData の接続機能を以下の目的で使用しています:
- IAM 認証情報、アクセスキー、インスタンスプロファイルなど、さまざまな方法で安全に認証できます。多様なセキュリティニーズに対応し、認証プロセスを簡素化します。
- 詳細なエラーメッセージにより、セットアップを効率化し、問題を迅速に解決できます。
- サーバーサイドでのクエリ実行により、パフォーマンスを向上させ、クライアントリソースへの負荷を最小限に抑えます。
ユーザーは、Tableau、Power BI、Excel などの分析ツールと Athena を統合し、お気に入りのツールから詳細な分析を行うことができます。
CData を使用した Amazon Athena のユニークなユースケースについては、ブログ記事をご覧ください:https://jp.cdata.com/blog/amazon-athena-use-cases
はじめに
Amazon Athena のデータに接続
ODBC データソース名の設定
まだ設定していない場合は、データソース名(DSN)で必要な接続プロパティを指定します。Microsoft ODBC データソースアドミニストレーターを使って DSN を作成・設定できます。これはドライバーインストールの最終ステップでも可能です。Microsoft ODBC データソースアドミニストレーターを使った DSN の作成と設定方法については、ヘルプドキュメントの「はじめに」を参照してください。
Amazon Athena 接続プロパティの取得・設定方法
それでは、早速Athena に接続していきましょう。
データに接続するには、以下の接続パラメータを指定します。
- DataSource:接続するAmazon Athena データソース。
- Database:接続するAmazon Athena データベース。
- AWSRegion:Amazon Athena データがホストされているリージョン。
- S3StagingDirectory:クエリの結果を保存するS3 フォルダ。
Database またはDataSource が設定されていない場合、CData 製品はAmazon Athena の利用可能なデータソースからすべてのデータベースのリスト化を試みます。そのため、両方のプロパティを設定することでCData 製品のパフォーマンスが向上します。
Amazon Athena の認証設定
CData 製品は幅広い認証オプションに対応しています。詳しくはヘルプドキュメントの「はじめに」を参照してみてください。
AWS キーを取得
IAM ユーザーの認証情報を取得するには、以下のステップお試しください。
- IAM コンソールにサインインします。
- ナビゲーションペインでユーザーを選択します。
- ユーザーのアクセスキーを作成または管理するには、ユーザーを選択してからセキュリティ認証情報タブに移動します。
AWS ルートアカウントの資格情報を取得するには、以下のステップをお試しください。
- ルートアカウントの認証情報を使用してAWS 管理コンソールにサインインします。
- アカウント名または番号を選択します。
- 表示されたメニューでMy Security Credentials を選択します。
- ルートアカウントのアクセスキーを管理または作成するには、Continue to Security Credentials をクリックし、[Access Keys]セクションを展開します。
その他の認証オプションについては、ヘルプドキュメントの「Amazon Athena への認証」を参照してください。
DSN を設定する際、Max Rows 接続プロパティを設定することもできます。これにより返される行数が制限され、レポートやビジュアライゼーションを作成する際のパフォーマンス向上に役立ちます。
Clear Analytics でデータソースを設定
- Excel を開き、CLEAR ANALYTICS リボンに移動します。Data Manager を開きます。
- データソースとして Database を選択します。
- Set Connection セクションで、新しいデータベースを作成するオプションをクリックします。
- データソースとして Microsoft ODBC Data Source を選択し、OK をクリックします。
- ドロップダウンメニューから、先ほど設定した DSN を選択します。

- Set Connection セクションに戻り、SQL Builder Provider として Standard (ANSI ODBC) Query Builder を選択して Next をクリックします。
- Schema/Owner を選択し、Clear Analytics で使用するドメイン(テーブル)を選択します。

- 必要に応じて、テーブルやカラムの表示名と説明をカスタマイズしてデータオブジェクトを準備します。
- CData ODBC ドライバーの大半では、ドメインにキー日付を設定する必要はありません。
- Domain Relations セクションで、テーブル間のリレーション情報を追加します。
- Domain Tree セクションで、データのグループを作成し、利用可能な項目をグループに追加します。

- データのサマリーを確認し、Finish をクリックします。
Amazon Athena のデータでチャートを作成
これでAmazon Athena のデータ を使ったチャートを作成する準備ができました。
新規クエリの作成
- CLEAR ANALYTICS リボンの Repository をクリックします。
- 新しいクエリを作成します。
- 取得するカラムを選択します。
- データの集計タイプを設定します(データを集計しない場合は空白のエントリを使用します)。
- カラムを下のウィンドウにドラッグして、フィルタと数式を設定します。
- クエリに名前を付けて Save をクリックします。

クエリレポートに基づいてチャートを作成
クエリを作成したら、レポートを実行してチャートを表示する準備ができました。- CLEAR ANALYTICS リボンの Report Explorer をクリックします。
- Report Explorer ペインで、ツールバーの「New Report」アイコンをクリックします。
- 先ほど作成したクエリを選択します。
- レポートに名前を付けて「Save and Execute」をクリックします。

- Report Explorer 内の Results タブをクリックします。
- レポートを展開し、チャートを Excel スプレッドシートにドラッグします。
- 表示される PivotChart ウィンドウで、フィールド(カラム)を Filters、Legends、Axis (Categories)、Values ウィンドウにドラッグします。

Clear Analytics で新しいデータソースを確立し、チャートを作成したら、Amazon Athena のデータ の分析を始める準備ができました。ODBC Driver for Amazon Athena と Clear Analytics を使用すると、Amazon Athena からのライブデータを使って Excel でセルフサービス分析を実行できます。