Google Data Fusion で HubDB に連携した ETL プロセスを作成

Jerod Johnson
Jerod Johnson
Director, Technology Evangelism
CData JDBC Driver を Google Data Fusion にロードし、HubDB のデータ にリアルタイムでアクセスできる ETL プロセスを作成します。

Google Data Fusion を使用すると、セルフサービス型のデータ連携を行い、異なるデータソースを統合できます。CData JDBC Driver for HubDB をアップロードすることで、Google Data Fusion のパイプライン内から HubDB のデータ にリアルタイムでアクセスできるようになります。CData JDBC Driver を使用すると、HubDB のデータ を Google Data Fusion でネイティブにサポートされている任意のデータソースにパイプできますが、この記事では、HubDB から Google BigQuery へデータをパイプする方法を説明します。

CData JDBC Driver for HubDB を Google Data Fusion にアップロード

CData JDBC Driver for HubDB を Google Data Fusion インスタンスにアップロードして、HubDB のデータ にリアルタイムでアクセスしましょう。Google Data Fusion では JDBC ドライバーの命名規則に制限があるため、JAR ファイルを driver-version.jar という形式に合わせてコピーまたはリネームしてください。例:cdatahubdb-2020.jar

  1. Google Data Fusion インスタンスを開きます
  2. をクリックしてエンティティを追加し、ドライバーをアップロードします
  3. "Upload driver" タブで、リネームした JAR ファイルをドラッグまたは参照します。
  4. "Driver configuration" タブで以下を設定します:
    • Name: ドライバーの名前(cdata.jdbc.hubdb)を作成し、メモしておきます
    • Class name: JDBC クラス名を設定します:(cdata.jdbc.hubdb.HubDBDriver)
  5. "Finish" をクリックします

Google Data Fusion で HubDB のデータ に接続

JDBC Driver をアップロードしたら、Google Data Fusion のパイプラインで HubDB のデータ にリアルタイムでアクセスできます。

  1. Pipeline Studio に移動して、新しいパイプラインを作成します
  2. "Source" オプションから "Database" をクリックして、JDBC Driver 用のソースを追加します
  3. Database ソースの "Properties" をクリックしてプロパティを編集します

    NOTE:Google Data Fusion で JDBC Driver を使用するには、ライセンス(製品版またはトライアル)とランタイムキー(RTK)が必要です。ライセンス(またはトライアル)の取得については、CData までお問い合わせください。

    • Label を設定します
    • Reference Name を将来の参照用の値に設定します(例:cdata-hubdb)
    • Plugin Type を "jdbc" に設定します
    • Connection String を HubDB の JDBC URL に設定します。例:

      jdbc:hubdb:RTK=5246...;AuthScheme=OAuth;OAuthClientID=MyOAuthClientID;OAuthClientSecret=MyOAuthClientSecret;CallbackURL=http://localhost:33333;

      HubDBデータソースへの接続には、パブリックHubSpotアプリケーションを使用したOAuth認証とプライベートアプリケーショントークンを使用した認証の2つの方法があります。

      カスタムOAuthアプリを使用する

      すべてのOAuthフローでAuthSchemeを"OAuth"に設定する必要があります。特定の認証ニーズ(デスクトップアプリケーション、Webアプリケーション、ヘッドレスマシン)に必要な接続プロパティについては、ヘルプドキュメントを確認してください。

      アプリケーションを登録し、OAuthクライアント認証情報を取得するには、以下の手順を実行してください。

      1. HubSpotアプリ開発者アカウントにログインします。
        • アプリ開発者アカウントである必要があります。標準のHubSpotアカウントではパブリックアプリを作成できません。
      2. 開発者アカウントのホームページで、アプリタブをクリックします。
      3. アプリを作成をクリックします。
      4. アプリ情報タブで、ユーザーが接続する際に表示される値を入力し、必要に応じて変更します。これらの値には、パブリックアプリケーション名、アプリケーションロゴ、アプリケーションの説明が含まれます。
      5. 認証タブで、「リダイレクトURL」ボックスにコールバックURLを入力します。
        • デスクトップアプリケーションを作成する場合は、http://localhost:33333のようなローカルにアクセス可能なURLに設定します。
        • Webアプリケーションを作成する場合は、ユーザーがアプリケーションを承認した際にリダイレクトされる信頼できるURLに設定します。
      6. アプリを作成をクリックします。HubSpotがアプリケーションとそれに関連する認証情報を生成します。
      7. 認証タブで、クライアントIDクライアントシークレットを確認します。これらは後でドライバーを設定する際に使用します。
      8. スコープの下で、アプリケーションの意図する機能に必要なスコープを選択します。

        テーブルにアクセスするには、最低限以下のスコープが必要です:

        • hubdb
        • oauth
        • crm.objects.owners.read
      9. 変更を保存をクリックします。
      10. 統合に必要な機能にアクセスできる本番ポータルにアプリケーションをインストールします。
        • 「インストールURL(OAuth)」の下で、完全なURLをコピーをクリックして、アプリケーションのインストールURLをコピーします。
        • コピーしたリンクをブラウザで開きます。アプリケーションをインストールする標準アカウントを選択します。
        • アプリを接続をクリックします。結果のタブは閉じて構いません。

      プライベートアプリを使用する

      HubSpotプライベートアプリケーショントークンを使用して接続するには、AuthSchemeプロパティを"PrivateApp"に設定します。

      以下の手順に従ってプライベートアプリケーショントークンを生成できます:

      1. HubDBアカウントで、メインナビゲーションバーの設定アイコン(歯車)をクリックします。
      2. 左サイドバーメニューで、統合 > プライベートアプリに移動します。
      3. プライベートアプリを作成をクリックします。
      4. 基本情報タブで、アプリケーションの詳細(名前、ロゴ、説明)を設定します。
      5. スコープタブで、プライベートアプリケーションがアクセスできるようにしたい各スコープに対して読み取りまたは書き込みを選択します。
      6. テーブルにアクセスするには、最低限hubdbとcrm.objects.owners.readが必要です。
      7. アプリケーションの設定が完了したら、右上のアプリを作成をクリックします。
      8. アプリケーションのアクセストークンに関する情報を確認し、作成を続行をクリックし、その後トークンを表示をクリックします。
      9. コピーをクリックして、プライベートアプリケーショントークンをコピーします。

      接続するには、PrivateAppTokenを取得したプライベートアプリケーショントークンに設定します。

      ビルトイン接続文字列デザイナー

      JDBC URL の作成には、HubDB JDBC Driver に組み込まれている接続文字列デザイナーを使用できます。JAR ファイルをダブルクリックするか、コマンドラインから JAR ファイルを実行してください。

            java -jar cdata.jdbc.hubdb.jar
            

      接続プロパティを入力し、接続文字列をクリップボードにコピーします。

    • Import Query を HubDB から取得したいデータを抽出する SQL クエリに設定します。例:
      SELECT * FROM NorthwindProducts
  4. "Sink" タブから、同期先シンクを追加します(この例では Google BigQuery を使用します)
  5. BigQuery シンクの "Properties" をクリックしてプロパティを編集します
    • Label を設定します
    • Reference Name を hubdb-bigquery のような値に設定します
    • Project ID を特定の Google BigQuery プロジェクト ID に設定します(またはデフォルトの "auto-detect" のままにします)
    • Dataset を特定の Google BigQuery データセットに設定します
    • Table を HubDB のデータ を挿入するテーブル名に設定します

Source と Sink を設定すると、HubDB のデータ を Google BigQuery にパイプする準備が整います。パイプラインを保存してデプロイしてください。パイプラインを実行すると、Google Data Fusion が HubDB からリアルタイムデータをリクエストし、Google BigQuery にインポートします。

これはシンプルなパイプラインの例ですが、変換、分析、条件などを使用してより複雑な HubDB パイプラインを作成できます。CData JDBC Driver for HubDB の 30日間の無償トライアルをダウンロードして、今すぐ Google Data Fusion で HubDB のデータ をリアルタイムで活用しましょう。

はじめる準備はできましたか?

HubDB Driver の無料トライアルをダウンロードしてお試しください:

 ダウンロード

詳細:

HubDB Icon HubDB JDBC Driver お問い合わせ

HubDB データと連携するパワフルなJava アプリケーションを短時間・低コストで作成して配布できます。