はじめに
CData Virtualityは、エンタープライズグレードのデータ仮想化プラットフォームです。データ仮想化によるリアルタイムデータアクセスとデータレプリケーションのバイモーダルによるデータ連携を提供します。本記事では、Google BigQuery内のデータを仮想統合して活用する手順をご紹介します。
事前準備
CData Virtualityには、インストール版とフルマネージドクラウド(SaaS)版がございます。入手および初期設定方法は以下の記事をご参照ください。
- CData Virtuality - 製品のインストール、および、初期設定方法 (Windows版)
- CData Virtuality - 無償トライアル、および、初期設定方法 (SaaS版)
Boogle BigQueryへの接続
CData Virtuality WebInterfaceにて「Connections > Source」メニューより「+New Connection」でGoogle BigQueryへの接続を追加します。
検索ボックスで「BigQuery」と検索すると2つの「Google BigQuery」のデータソースがヒットします。画面「左」の文字が折り返しの「Google <折り返し> BigQuery」が従来よりCData Virtualityが提供していたデータソースで、画面「右」の「Google BigQuery」がCData Driverが組み込まれているデータソースとなります。本記事では、画面「左」の文字が折り返しの「Google <折り返し> BigQuery」を利用します。折り返し>折り返し>
Google BigQuery への接続情報を設定する画面が開きます。
以下の項目をセットして「Connect」ボタンをクリックします。
- Datasouce name : 任意(本例では「bigquery」)
- Project number : ※1
- Dataset : ※2
- Client ID : ※3
- Secret : ※4
- Redirect URL : デフォルト値(http://localhost:8080/account/redirect.html?to=sources/connect/bigquery)
※1 Project number(プロジェクト番号)についてはGoogle Cloud Platformでプロジェクトを選択すると確認できます。詳細は「Don't know your Project number?」をクリックして確認してください。
※2 Datasetについては、BigQury内のデータセット名を入力ください。本例では「demo」
※3 ClientID /Secret については、「Google Auth Platform」にて「ウェブアプリケーションのクライアントID」を作成してクライアントID(Client ID)とクライアントシークレット(Secret)を取得してください
上記プロパティ値をセットしたら「Sign in with Google」ボタンをクリックします。
Googleへのログイン画面が表示されるので、ログインして、アプリの許可を認可します。
接続に成功すると、Google BigQuery内のテーブル一覧が表示されます。
接続に失敗する場合は弊社テクニカルサポートにお問い合わせください。
「Model and Manage Your Data」内の「Go to Code Editior」ボタンをクリックしてCode Editor画面を開きます。
コードエディタからの確認
Code Editorを開き、Data Sources内に上記手順で作成したGoogle BigQueryのデータソース(本例では「bigquery」)が追加されていることを確認します。
Google BigQueryのデータソースをクリックして、Google BigQueryのテーブルの右3点をクリックして「Generate Statement」を選択します。EditorエリアにSELECT Statementが生成されたらSQLを「▶︎(Run Script)」で実行します。Google BigQuery内のレコードデータが取得できれば成功です。
まとめ
本記事では、Google BigQuery内のテーブルデータを仮想統合して活用する手順をご紹介しました。CData Virtualityはフルマネージドクラウド(SaaS)版、および、インストール版で無償トライアルを提供しています。無償トライアルを始められたい方や設定を進める中でご不明な点が出てきた際には弊社テクニカルサポートまでお問い合わせください。