DBxtra でAzure Data Lake Storage のデータを使ってダッシュボードを構築
CData のAzure Data Lake Storage 用 ODBC ドライバーは、ODBC 標準経由でAzure Data Lake Storage のリアルタイムデータにアクセスし、使い慣れた SQL クエリで各種 BI、レポート、ETL ツールからAzure Data Lake Storage のデータを利用可能にします。この記事では、汎用 ODBC データプロバイダーとしてAzure Data Lake Storage に接続し、DBxtra でAzure Data Lake Storage のデータを基にしたチャート、レポート、ダッシュボードを作成する方法を解説します。
Azure Data Lake Storage のデータへの接続設定
- まだ設定していない場合は、データソース名(DSN)で必要な接続プロパティを指定します。DSN の設定は組み込みの Microsoft ODBC データソースアドミニストレーターを使用して行えます。これはドライバーインストールの最終ステップでもあります。Microsoft ODBC データソースアドミニストレーターを使用して DSN を作成・設定する方法については、ヘルプドキュメントの「はじめに」の章をご参照ください。
Azure Data Lake Storage 接続プロパティの取得・設定方法
Azure Data Lake Storage Gen2 への接続
それでは、Gen2 Data Lake Storage アカウントに接続していきましょう。接続するには、以下のプロパティを設定します。
- Account:ストレージアカウントの名前
- FileSystem:このアカウントに使用されるファイルシステム名。例えば、Azure Blob コンテナの名前
- Directory(オプション):レプリケートされたファイルが保存される場所へのパス。パスが指定されない場合、ファイルはルートディレクトリに保存されます
Azure Data Lake Storage Gen2への認証
続いて、認証方法を設定しましょう。CData 製品では、5つの認証方法をサポートしています:アクセスキー(AccessKey)の使用、共有アクセス署名(SAS)の使用、Azure Active Directory OAuth(AzureAD)経由、Azure サービスプリンシパル(AzureServicePrincipal またはAzureServicePrincipalCert)経由、およびManaged Service Identity(AzureMSI)経由です。
アクセスキー
アクセスキーを使用して接続するには、まずADLS Gen2ストレージアカウントで利用可能なアクセスキーを取得する必要があります。
Azure ポータルでの手順は以下のとおりです:
- ADLS Gen2ストレージアカウントにアクセスします
- 設定でアクセスキーを選択します
- 利用可能なアクセスキーの1つの値をAccessKey 接続プロパティにコピーします
接続の準備ができたら、以下のプロパティを設定してください。
- AuthScheme:AccessKey
- AccessKey:先ほどAzure ポータルで取得したアクセスキーの値
共有アクセス署名(SAS)
共有アクセス署名を使用して接続するには、まずAzure Storage Explorer ツールを使用して署名を生成する必要があります。
接続の準備ができたら、以下のプロパティを設定してください。
- AuthScheme:SAS
- SharedAccessSignature:先ほど生成した共有アクセス署名の値
その他の認証方法については、 href="/kb/help/" target="_blank">ヘルプドキュメントの「Azure Data Lake Storage Gen2への認証」セクションをご確認ください。
DSN を設定する際には、Max Rows 接続プロパティも設定することをお勧めします。これにより返される行数が制限され、レポートやビジュアライゼーションの設計時にパフォーマンスを向上させるのに役立ちます。
- DBxtra アプリケーションを開き、New メニューから Project をクリックしてプロジェクト名を入力します。

- Data Connection Type として ODBC Connection を選択します。

- Data Source の参照オプション()をクリックします。
- Data Link Properties ウィンドウの Provider タブで、Microsoft OLE DB Provider for ODBC Drivers を選択します。

- Connection タブで、Data Source Name と使用する初期カタログ(CData)を選択します。

- 接続名を入力し、適切なユーザーグループを選択します。

- プロジェクト内で接続をダブルクリックしてデータに接続します。

Azure Data Lake Storage のデータでダッシュボードを作成
これでAzure Data Lake Storage のデータを使ってダッシュボードを作成する準備が整いました。
- プロジェクト内の Report Objects を右クリックし、New Report Object を選択します。

- 新しい Report Object で、リンクをクリックしてクエリを作成します。
- Select Data Connection ウィンドウで、先ほど作成したデータ接続を選択します。

- Query タブで、接続オブジェクトを展開し、ダッシュボードに含めたいテーブル、ビュー、特定のカラムを選択します。検索条件を指定したり、JOIN や集計を含む複雑なクエリを作成することもできます。

- Dashboard タブで、ダッシュボードのビジュアライゼーションと機能を選択します。クエリからのデータ値をダッシュボード項目の適切なフィールド(Values、Series など)に割り当てます。

新しいダッシュボードが作成されたら、Azure Data Lake Storage のデータ分析を開始できます。Azure Data Lake Storage 用 ODBC ドライバーのおかげで、ダッシュボードを更新すればソースで行われた変更を即座に確認できます。同様に、常に最新のAzure Data Lake Storage データを反映したレポートを作成・表示できます。