PowerBI.com でAzure Data Lake Storage Dataflows を作成

Jerod Johnson
Jerod Johnson
Senior Technology Evangelist
CData Power BI Connector を PowerBI.com から接続し、リアルタイムデータで Power BI Dataflows を作成。

CData Power BI Connector for Azure Data Lake Storage は、Power BI のツールやウィザードとシームレスに統合し、PowerBI.com 上のリアルタイムデータワークフローにも対応しています。以下の手順に従って、PowerBI.com の DataFlows にデータを直接取り込み、Power BI Gateway を使用して自動更新を設定しましょう。

DSN の作成

Power BI Connector をインストールすると、CData Power BI Azure Data Lake Storage という名前の DSN(データソース名)が作成されます。これは、Power BI がデータソースへの接続を要求する際に使用する DSN 名です。必要な接続プロパティを入力して DSN を設定します。

Microsoft ODBC データソースアドミニストレーターを使用して、新しい DSN を作成するか、既存の DSN を設定(および名前変更)できます。スタートメニューから「ODBC データソース」と入力します。Power BI Desktop のインストールに対応するビット数(32 ビットまたは 64 ビット)の ODBC アドミニストレーターを実行してください。

Azure Data Lake Storage 接続プロパティの取得・設定方法

Azure Data Lake Storage Gen2 への接続

それでは、Gen2 Data Lake Storage アカウントに接続していきましょう。接続するには、以下のプロパティを設定します。

  • Account:ストレージアカウントの名前
  • FileSystem:このアカウントに使用されるファイルシステム名。例えば、Azure Blob コンテナの名前
  • Directory(オプション):レプリケートされたファイルが保存される場所へのパス。パスが指定されない場合、ファイルはルートディレクトリに保存されます

Azure Data Lake Storage Gen2への認証

続いて、認証方法を設定しましょう。CData 製品では、5つの認証方法をサポートしています:アクセスキー(AccessKey)の使用、共有アクセス署名(SAS)の使用、Azure Active Directory OAuth(AzureAD)経由、Azure サービスプリンシパル(AzureServicePrincipal またはAzureServicePrincipalCert)経由、およびManaged Service Identity(AzureMSI)経由です。

アクセスキー

アクセスキーを使用して接続するには、まずADLS Gen2ストレージアカウントで利用可能なアクセスキーを取得する必要があります。

Azure ポータルでの手順は以下のとおりです:

  1. ADLS Gen2ストレージアカウントにアクセスします
  2. 設定でアクセスキーを選択します
  3. 利用可能なアクセスキーの1つの値をAccessKey 接続プロパティにコピーします

接続の準備ができたら、以下のプロパティを設定してください。

  • AuthSchemeAccessKey
  • AccessKey:先ほどAzure ポータルで取得したアクセスキーの値

共有アクセス署名(SAS)

共有アクセス署名を使用して接続するには、まずAzure Storage Explorer ツールを使用して署名を生成する必要があります。

接続の準備ができたら、以下のプロパティを設定してください。

  • AuthSchemeSAS
  • SharedAccessSignature:先ほど生成した共有アクセス署名の値

その他の認証方法については、 href="/kb/help/" target="_blank">ヘルプドキュメントの「Azure Data Lake Storage Gen2への認証」セクションをご確認ください。

Azure Data Lake Storage データを Dataflow に直接取り込む

データソースの設定が完了したら、以下の手順に従って Azure Data Lake Storage テーブルから DataFlow にデータを読み込みます。

Power BI Gateway の設定

以下の手順に従って、お使いのマシンでゲートウェイを設定します:

  1. CData Power BI Connector インストーラーを実行します。まだダウンロードしていない場合は、Power BI Gateway をダウンロードしてください。
  2. オンプレミスデータゲートウェイ(推奨)オプションを選択します。
  3. ゲートウェイにサインインします。
  4. ゲートウェイに名前を付け、回復キーを指定します。
  5. Connectors ステップで、ゲートウェイが CData Power BI Connector を検索するフォルダを選択します。この記事では C:\Users\PBIEgwService\Documents\Power BI Desktop\Custom Connectors\ を使用します。CData Connector の .pqx ファイル(C:\Users\USERNAME\Documents\Power BI Desktop\Custom Connectors\ にあります)を設定したフォルダにコピーします。

    注意:サービス用に設定されたアカウント(NT SERVICE\PBIEgwService)が、ゲートウェイ用に選択したフォルダにアクセスできる必要があります。必要に応じて、ゲートウェイインストーラーの Service Settings セクションでサービスアカウントを変更できます。

  6. Connectors セクションのリストに CData.PowerBI.ADLS エントリが表示されていることを確認します。

Power BI Online で Dataflow を設定する

  1. Power BI Online で、まだお持ちでない場合は新しいワークスペース(アプリとも呼ばれます)を作成します。これは Power BI Pro 以上でのみ利用可能です。
  2. オンプレミスゲートウェイを設定します。手順はこの記事の「ゲートウェイの設定」セクションに記載されています。
  3. Power BI Online に戻ります。設定で「ゲートウェイの管理」に移動し、ゲートウェイに新しいデータソースを追加します
    • Data Source Name(Power BI Online 内でデータソースを参照する名前)を入力します
    • Data Source Type(例:CData Power BI Connector for Azure Data Lake Storage)を選択し、Data Source Name(例:CData Power BI Azure Data Lake Storage)を設定します
    • Authentication Method を「Anonymous」に設定します
    • 必要に応じて Privacy Level を設定します
  4. Add をクリックして設定を完了します(接続が成功したかどうかを確認することが重要なため、テスト接続をスキップしないでください)。

    このデータソースにアクセスできるユーザーを管理する場合は、Users タブに移動できます。

Dataflow を設定してAzure Data Lake Storage データを取得する

  1. 新しいワークスペースで、Create > Dataflow > Add New Entities に移動します。
  2. ODBC データソースを選択し、正しい接続プロパティを入力します。
    ODBC connection string セクションに DSN 名を入力します:dsn=CData Power BI ADLS。ゲートウェイを選択し、認証タイプを Anonymous に設定します。
  3. 使用するテーブルを選択し、Transform data をクリックします。
    クエリを変更する場合は、クエリを右クリックして Advanced Editor をクリックします。

PowerBI.com でデータ更新を設定

Dataflow を更新して、最新のデータを取得します。

  • 手動で更新するには、ワークスペース -> Dataflows から Dataflow のオプションメニューを開き、Refresh Now をクリックします。
  • スケジュール更新を設定するには、ワークスペース -> Dataflows から Dataflow のオプションメニューを開き、Schedule Refresh をクリックします。 データを最新の状態に保つオプションを有効にし、メニューで更新頻度を指定します。

これで、リアルタイムのAzure Data Lake Storage のデータ上に構築された Dataflow が完成しました。Azure Data Lake Storage 用 CData Power BI Connector の詳細については、CData Power BI Connector for Azure Data Lake Storage ページで無料トライアルをダウンロードしてご確認ください。ご質問がある場合は、サポートチームまでお問い合わせください。

はじめる準備はできましたか?

Azure Data Lake Storage Power BI Connector の無料トライアルをダウンロードしてお試しください:

 ダウンロード

詳細:

Azure Data Lake Storage Icon Azure Data Lake Storage Power BI Connector お問い合わせ

Azure Data Lake Storage データにPower BI から接続する最適解。ハイパフォーマンスなデータアクセス、リアルタイム連携、拡張メタデータ検出、強力なSQL-92 サポートを提供。