Google Data Fusion で LDAP に連携した ETL プロセスを作成

Jerod Johnson
Jerod Johnson
Director, Technology Evangelism
CData JDBC Driver を Google Data Fusion にロードし、LDAP objects にリアルタイムでアクセスできる ETL プロセスを作成します。

Google Data Fusion を使用すると、セルフサービス型のデータ連携を行い、異なるデータソースを統合できます。CData JDBC Driver for LDAP をアップロードすることで、Google Data Fusion のパイプライン内から LDAP objects にリアルタイムでアクセスできるようになります。CData JDBC Driver を使用すると、LDAP objects を Google Data Fusion でネイティブにサポートされている任意のデータソースにパイプできますが、この記事では、LDAP から Google BigQuery へデータをパイプする方法を説明します。

CData JDBC Driver for LDAP を Google Data Fusion にアップロード

CData JDBC Driver for LDAP を Google Data Fusion インスタンスにアップロードして、LDAP objects にリアルタイムでアクセスしましょう。Google Data Fusion では JDBC ドライバーの命名規則に制限があるため、JAR ファイルを driver-version.jar という形式に合わせてコピーまたはリネームしてください。例:cdataldap-2020.jar

  1. Google Data Fusion インスタンスを開きます
  2. をクリックしてエンティティを追加し、ドライバーをアップロードします
  3. "Upload driver" タブで、リネームした JAR ファイルをドラッグまたは参照します。
  4. "Driver configuration" タブで以下を設定します:
    • Name: ドライバーの名前(cdata.jdbc.ldap)を作成し、メモしておきます
    • Class name: JDBC クラス名を設定します:(cdata.jdbc.ldap.LDAPDriver)
  5. "Finish" をクリックします

Google Data Fusion で LDAP Objects に接続

JDBC Driver をアップロードしたら、Google Data Fusion のパイプラインで LDAP objects にリアルタイムでアクセスできます。

  1. Pipeline Studio に移動して、新しいパイプラインを作成します
  2. "Source" オプションから "Database" をクリックして、JDBC Driver 用のソースを追加します
  3. Database ソースの "Properties" をクリックしてプロパティを編集します

    NOTE:Google Data Fusion で JDBC Driver を使用するには、ライセンス(製品版またはトライアル)とランタイムキー(RTK)が必要です。ライセンス(またはトライアル)の取得については、CData までお問い合わせください。

    • Label を設定します
    • Reference Name を将来の参照用の値に設定します(例:cdata-ldap)
    • Plugin Type を "jdbc" に設定します
    • Connection String を LDAP の JDBC URL に設定します。例:

      jdbc:ldap:RTK=5246...;User=Domain\BobF;Password=bob123456;Server=10.0.1.1;Port=389;

      リクエストを認証するには、User およびPassword プロパティを有効なLDAP クレデンシャル(例えば、User を"Domain\BobF" または"cn=Bob F,ou=Employees,dc=Domain")に設定します。 CData 製品は、デフォルトでプレーンテキスト認証を使用します。これは、CData 製品がサーバーとTLS/SSL のネゴシエーションを試みるためです。 AuthMechanism を使って別の認証方法を指定できます。 TLS/SSL コンフィギュレーションについて詳しくは、ヘルプドキュメントの「高度な設定」を参照してください。

        基本接続には、Server およびPort を設定します。さらに、次のように接続を微調整できます。
      • FollowReferrals:設定すると、CData 製品は参照サーバーのデータもビューとして表示します。参照サーバー上のデータを変更するには、このサーバーをServer およびPort で指定する必要があります。
      • LDAPVersion:サーバーが実装するプロトコルのバージョンに設定します。デフォルトでは、CData 製品はversion 2 を使用します。
      • BaseDN は、LDAP 検索の範囲を指定された識別名の高さに限定します。BaseDN の範囲を絞ることはパフォーマンスを劇的に向上させます。例えば、"cn=users,dc=domain" の値は、"cn=users" およびその子に含まれる結果のみを返します。
      • Scope:このプロパティを使用すると、サブツリーから返されるデータをより細かく制御できます。

      ビルトイン接続文字列デザイナー

      JDBC URL の作成には、LDAP JDBC Driver に組み込まれている接続文字列デザイナーを使用できます。JAR ファイルをダブルクリックするか、コマンドラインから JAR ファイルを実行してください。

            java -jar cdata.jdbc.ldap.jar
            

      接続プロパティを入力し、接続文字列をクリップボードにコピーします。

    • Import Query を LDAP から取得したいデータを抽出する SQL クエリに設定します。例:
      SELECT * FROM User
  4. "Sink" タブから、同期先シンクを追加します(この例では Google BigQuery を使用します)
  5. BigQuery シンクの "Properties" をクリックしてプロパティを編集します
    • Label を設定します
    • Reference Name を ldap-bigquery のような値に設定します
    • Project ID を特定の Google BigQuery プロジェクト ID に設定します(またはデフォルトの "auto-detect" のままにします)
    • Dataset を特定の Google BigQuery データセットに設定します
    • Table を LDAP objects を挿入するテーブル名に設定します

Source と Sink を設定すると、LDAP objects を Google BigQuery にパイプする準備が整います。パイプラインを保存してデプロイしてください。パイプラインを実行すると、Google Data Fusion が LDAP からリアルタイムデータをリクエストし、Google BigQuery にインポートします。

これはシンプルなパイプラインの例ですが、変換、分析、条件などを使用してより複雑な LDAP パイプラインを作成できます。CData JDBC Driver for LDAP の 30日間の無償トライアルをダウンロードして、今すぐ Google Data Fusion で LDAP objects をリアルタイムで活用しましょう。

はじめる準備はできましたか?

LDAP Driver の無料トライアルをダウンロードしてお試しください:

 ダウンロード

詳細:

LDAP Icon LDAP JDBC Driver お問い合わせ

LDAP ディレクトリサービスを組み込んだパワフルなJava アプリケーションを短時間・低コストで作成して配布できます。