PowerBI.com でJSON Dataflows を作成
CData Power BI Connector for JSON は、Power BI のツールやウィザードとシームレスに統合し、PowerBI.com 上のリアルタイムデータワークフローにも対応しています。以下の手順に従って、PowerBI.com の DataFlows にデータを直接取り込み、Power BI Gateway を使用して自動更新を設定しましょう。
DSN の作成
Power BI Connector をインストールすると、CData Power BI JSON という名前の DSN(データソース名)が作成されます。これは、Power BI がデータソースへの接続を要求する際に使用する DSN 名です。必要な接続プロパティを入力して DSN を設定します。
Microsoft ODBC データソースアドミニストレーターを使用して、新しい DSN を作成するか、既存の DSN を設定(および名前変更)できます。スタートメニューから「ODBC データソース」と入力します。Power BI Desktop のインストールに対応するビット数(32 ビットまたは 64 ビット)の ODBC アドミニストレーターを実行してください。
データソースへの認証については、ヘルプドキュメントの「はじめに」を参照してください。CData 製品は、JSON API を双方向データベーステーブルとして、JSON ファイルを読み取り専用ビュー(ローカル ファイル、一般的なクラウドサービスに保存されているファイル、FTP サーバー)としてモデル化します。HTTP Basic、Digest、NTLM、OAuth、FTP などの主要な認証スキームがサポートされています。詳細はヘルプドキュメントの「はじめに」を参照してください。
URI を設定して認証値を入力したら、DataModel を設定してデータ表現とデータ構造をより厳密に一致させます。
DataModel プロパティは、データをどのようにテーブルに表現するかを制御するプロパティで、次の基本設定を切り替えます。
- Document(デフォルト):JSON データのトップレベルのドキュメントビューをモデル化します。CData 製品 は、ネストされたオブジェクト配列を集約されたJSON オブジェクトとして返します。
- FlattenedDocuments:ネストされた配列オブジェクトと親オブジェクトを、単一テーブルに暗黙的に結合します。
- Relational:階層データから個々の関連テーブルを返します。テーブルには、親ドキュメントにリンクする主キーと外部キーが含まれています。
リレーショナル表現の設定についての詳細は、ヘルプドキュメントの「JSON データのモデリング」を参照してください。また、以下の例で使用されているサンプルデータも確認できます。データには人や所有する車、それらの車に行われたさまざまなメンテナンスサービスのエントリが含まれています。
Amazon S3 内のJSON への接続
URI をバケット内のJSON ドキュメントに設定します。さらに、次のプロパティを設定して認証します。
- AWSAccessKey:AWS アクセスキー(username)に設定。
- AWSSecretKey:AWS シークレットキーに設定。
Box 内のJSON への接続
URI をJSON ファイルへのパスに設定します。Box へ認証するには、OAuth 認証標準を使います。 認証方法については、Box への接続 を参照してください。
Dropbox 内のJSON への接続
URI をJSON ファイルへのパスに設定します。Dropbox へ認証するには、OAuth 認証標準を使います。 認証方法については、Dropbox への接続 を参照してください。ユーザーアカウントまたはサービスアカウントで認証できます。ユーザーアカウントフローでは、以下の接続文字列で示すように、ユーザー資格情報の接続プロパティを設定する必要はありません。 URI=dropbox://folder1/file.json; InitiateOAuth=GETANDREFRESH; OAuthClientId=oauthclientid1; OAuthClientSecret=oauthcliensecret1; CallbackUrl=http://localhost:12345;
SharePoint Online SOAP 内のJSON への接続
URI をJSON ファイルを含むドキュメントライブラリに設定します。認証するには、User、Password、およびStorageBaseURL を設定します。
SharePoint Online REST 内のJSON への接続
URI をJSON ファイルを含むドキュメントライブラリに設定します。StorageBaseURL は任意です。指定しない場合、ドライバーはルートドライブで動作します。 認証するには、OAuth 認証標準を使用します。
FTP 内のJSON への接続
URI をJSON ファイルへのパスが付いたサーバーのアドレスに設定します。認証するには、User およびPassword を設定します。
Google Drive 内のJSON への接続
デスクトップアプリケーションからのGoogle への認証には、InitiateOAuth をGETANDREFRESH に設定して、接続してください。詳細はドキュメントの「Google Drive への接続」を参照してください。
JSON データを Dataflow に直接取り込む
データソースの設定が完了したら、以下の手順に従って JSON テーブルから DataFlow にデータを読み込みます。
Power BI Gateway の設定
以下の手順に従って、お使いのマシンでゲートウェイを設定します:
- CData Power BI Connector インストーラーを実行します。まだダウンロードしていない場合は、Power BI Gateway をダウンロードしてください。
- オンプレミスデータゲートウェイ(推奨)オプションを選択します。
- ゲートウェイにサインインします。
- ゲートウェイに名前を付け、回復キーを指定します。
Connectors ステップで、ゲートウェイが CData Power BI Connector を検索するフォルダを選択します。この記事では C:\Users\PBIEgwService\Documents\Power BI Desktop\Custom Connectors\ を使用します。CData Connector の .pqx ファイル(C:\Users\USERNAME\Documents\Power BI Desktop\Custom Connectors\ にあります)を設定したフォルダにコピーします。
注意:サービス用に設定されたアカウント(NT SERVICE\PBIEgwService)が、ゲートウェイ用に選択したフォルダにアクセスできる必要があります。必要に応じて、ゲートウェイインストーラーの Service Settings セクションでサービスアカウントを変更できます。
- Connectors セクションのリストに CData.PowerBI.JSON エントリが表示されていることを確認します。
Power BI Online で Dataflow を設定する
- Power BI Online で、まだお持ちでない場合は新しいワークスペース(アプリとも呼ばれます)を作成します。これは Power BI Pro 以上でのみ利用可能です。
- オンプレミスゲートウェイを設定します。手順はこの記事の「ゲートウェイの設定」セクションに記載されています。
-
Power BI Online に戻ります。設定で「ゲートウェイの管理」に移動し、ゲートウェイに新しいデータソースを追加します
- Data Source Name(Power BI Online 内でデータソースを参照する名前)を入力します
- Data Source Type(例:CData Power BI Connector for JSON)を選択し、Data Source Name(例:CData Power BI JSON)を設定します
- Authentication Method を「Anonymous」に設定します
- 必要に応じて Privacy Level を設定します
-
Add をクリックして設定を完了します(接続が成功したかどうかを確認することが重要なため、テスト接続をスキップしないでください)。
このデータソースにアクセスできるユーザーを管理する場合は、Users タブに移動できます。
Dataflow を設定してJSON データを取得する
- 新しいワークスペースで、Create > Dataflow > Add New Entities に移動します。
-
ODBC データソースを選択し、正しい接続プロパティを入力します。
ODBC connection string セクションに DSN 名を入力します:dsn=CData Power BI JSON。ゲートウェイを選択し、認証タイプを Anonymous に設定します。
-
使用するテーブルを選択し、Transform data をクリックします。
クエリを変更する場合は、クエリを右クリックして Advanced Editor をクリックします。
PowerBI.com でデータ更新を設定
Dataflow を更新して、最新のデータを取得します。
- 手動で更新するには、ワークスペース -> Dataflows から Dataflow のオプションメニューを開き、Refresh Now をクリックします。
- スケジュール更新を設定するには、ワークスペース -> Dataflows から Dataflow のオプションメニューを開き、Schedule Refresh をクリックします。 データを最新の状態に保つオプションを有効にし、メニューで更新頻度を指定します。
これで、リアルタイムのJSON services上に構築された Dataflow が完成しました。JSON 用 CData Power BI Connector の詳細については、CData Power BI Connector for JSON ページで無料トライアルをダウンロードしてご確認ください。ご質問がある場合は、サポートチームまでお問い合わせください。