Informatica Enterprise Data Catalog で Spotify のデータ を追加

Jerod Johnson
Jerod Johnson
Director, Technology Evangelism
CData JDBC Driver for Spotify を Informatica Enterprise Data Catalog で使用し、データを分類・整理します。

Informatica は、データの転送と変換を行うための強力で洗練された手段を提供します。CData JDBC Driver for Spotify を使用すると、業界標準に準拠したドライバーを通じて Informatica Enterprise Data Catalog とシームレスに連携できます。このチュートリアルでは、あらゆる環境で Spotify データを分類・整理する方法を説明します。

JDBC ドライバーのロード

JDBC ドライバーをロードするには:

  1. Informatica が動作しているホストに JDBC ドライバーをインストールします。この記事では、ドライバーが cdata.jdbc.api.APIDriver にインストールされていることを前提としています。
  2. $ java -jar setup.jar
    
  3. JDBC インストールディレクトリに移動し、ドライバーとそのライセンスファイルを含む genericJDBC.zip という名前の zip ファイルを作成します。
  4. $ cd ~/cdata-jdbc-driver-for-api/lib
    $ zip genericJDBC.zip cdata.jdbc.api.jar cdata.jdbc.api.lic
    
  5. genericJDBC.zip ファイルを Informatica 内の Catalog Service ディレクトリに移動します。この記事では、Informatica が /opt/informatica にインストールされていることを前提としています。このフォルダでの作業には、おそらく root 権限が必要です。続行する前に、su または sudo で root に切り替えてください。
  6. # mv genericJDBC.zip /opt/informatica/services/CatalogService/ScannerBinaries
    
  7. zip ファイルを展開するために、カスタムデプロイメント設定を編集します。
  8. # cd /opt/informatica/services/CatalogService/ScannerBinaries/CustomDeployer/
    # nano scannerDeployer.xml
    

    既存の ExecutionContextProperty ノードを展開した後、以下の内容で新しい ExecutionContextProperty ノードを追加します。

    
    <ExecutionContextProperty
        isLocationProperty="true"
        dependencyToUnpack="genericJDBC.zip">
    <PropertyName>JDBCScanner_DriverLocation</PropertyName>
    <PropertyValue>scanner_miti/genericJDBC/Drivers</PropertyValue>
    </ExecutionContextProperty>
    
  9. Admin コンソールから Catalog Service をリフレッシュします。

JDBC リソースの設定

JDBC リソースを設定するには:

  1. Catalog 管理画面を開き、以下のプロパティで新しい JDBC リソースを追加します:
    • Driver Class: cdata.jdbc.api.APIDriver
    • URL: jdbc.api:Profile=C:\profiles\Spotify.apip;AuthScheme=OAuth;InitiateOAuth=GETANDREFRESH;OAuthClientId=your_client_id;OAuthClientSecret=your_client_secret;CallbackURL=http://localhost:33333;
    • OAuth 認証の設定

      Spotify は認証に OAuth 2.0 を使用します。クライアント認証情報を取得するには、Spotify Developer Dashboard でアプリケーションを作成する必要があります。

      Spotify アプリケーションのセットアップ

      1. Spotify Developer Dashboard にアクセスします。
      2. Spotify アカウントでログインして Create app をクリックします。
      3. アプリ名、説明を入力し、Redirect URI を設定します(デスクトップアプリケーションの場合は
        http://localhost:33333
        など)。
      4. アプリ設定から Client IDClient Secret をコピーします。

      接続プロパティ

      以下の接続プロパティを設定して接続を確立してください:

      • AuthScheme:OAuth に設定します。
      • InitiateOAuthGETANDREFRESH に設定します。InitiateOAuth を使うと、OAuthAccessToken を取得するプロセスを管理できます。
      • OAuthClientId:Spotify アプリケーションの Client ID に設定します。
      • OAuthClientSecret:Spotify アプリケーションの Client Secret に設定します。
      • Scope:必要な OAuth スコープ(スペース区切り)に設定します。デフォルトには、このプロファイルのテーブルに必要なすべての読み取りスコープが含まれます。
      • CallbackURL:Spotify アプリケーションで設定したリダイレクト URI に設定します(例:http://localhost:33333)。

      接続文字列の例

      Profile=C:\profiles\Spotify.apip;AuthScheme=OAuth;InitiateOAuth=GETANDREFRESH;OAuthClientId=your_client_id;OAuthClientSecret=your_client_secret;CallbackURL=http://localhost:33333;
      

      利用可能な OAuth スコープ

      • user-read-private:ユーザーのサブスクリプション詳細と露骨なコンテンツ設定への読み取りアクセス。
      • user-read-email:ユーザーのメールアドレスへの読み取りアクセス。
      • user-library-read:ユーザーが保存したトラック、アルバム、エピソード、ショー、オーディオブックへの読み取りアクセス。
      • playlist-read-private:ユーザーの非公開プレイリストへの読み取りアクセス。
      • playlist-read-collaborative:ユーザーがフォローしているコラボレーティブプレイリストへの読み取りアクセス。
      • user-follow-read:現在のユーザーがフォローしているアーティストの一覧への読み取りアクセス。
      • user-read-playback-state:ユーザーのプレーヤー状態(デバイス、現在のトラック、再生位置)への読み取りアクセス。
      • user-read-currently-playing:ユーザーが現在再生中のコンテンツへの読み取りアクセス。
      • user-read-playback-history:ユーザーが最近再生したトラックへの読み取りアクセス。
      • user-top-read:ユーザーのトップアーティストとトラックへの読み取りアクセス。

      組み込みの接続文字列デザイナー

      JDBC URL の構築については、Spotify JDBC Driver に組み込まれている接続文字列デザイナーを使用してください。.jar ファイルをダブルクリックするか、コマンドラインから .jar ファイルを実行します。

      java -jar cdata.jdbc.api.jar
      

      接続プロパティを入力し、接続文字列をクリップボードにコピーします。

      JDBC URL を設定する際に、Max Rows 接続プロパティも設定することをお勧めします。これにより返される行数が制限され、レポートやビジュアライゼーションの設計時にパフォーマンスを向上させることができます。

    一般的な追加の接続文字列プロパティは以下のとおりです:

    JDBC;MSTR_JDBC_JAR_FOLDER=PATH\TO\JAR\;DRIVER=cdata.jdbc.api.APIDriver;URL={jdbc:api:Profile=C:\profiles\Spotify.apip;AuthScheme=OAuth;InitiateOAuth=GETANDREFRESH;OAuthClientId=your_client_id;OAuthClientSecret=your_client_secret;CallbackURL=http://localhost:33333;};
    
  2. Username: user
  3. Password: password
  4. Username と Password プロパティは、使用するドライバーが必要としない場合でも必須です。その場合は、代わりにプレースホルダー値を入力してください。

  5. 少なくとも1つのソースメタデータスキャンを実行するために、メタデータオプションを設定します。このスキャンでは、ドライバーを使用してサービス経由で利用可能なテーブル、ビュー、ストアドプロシージャを特定します。
    • Source Metadata: このオプションを有効にします。
    • Catalog: マルチカタログのデータソースの場合は、適切なカタログに設定します。それ以外の場合は、CData に設定します。
    • Schema: マルチスキーマのデータソースの場合は、適切なスキーマに設定します。それ以外の場合は、サービス名(例:Couchbase)に設定します。
    • Case-sensitivity: 通常、このオプションは無効にしてください。大文字と小文字を区別するデータソースの場合のみ有効にします。
    • Import stored procedures: テーブルやビューに加えてストアドプロシージャの定義もインポートしたい場合は、これを有効にします。

    必要に応じて、他のメタデータスキャナーも有効にできます。

  6. ドライバーの設定を完了し、オプションでカスタム属性とスキャナースケジュールを設定します。
  7. Monitoring タブに移動し、Run をクリックしてメタデータスキャンを実行します。データソースによっては、数分かかる場合があります。

スキャンが完了すると、すべてのメタデータオブジェクトの概要と Metadata Load ジョブのステータスが表示されます。エラーが発生した場合は、ジョブの Log Location リンクを開いて、Informatica またはドライバーが報告したエラーを確認できます。

検出されたメタデータの確認

Catalog Service ブラウザを開いて、データソースから抽出されたメタデータを表示します。メタデータスキャナーの設定時に選択したオプションに応じて、定義したリソースのテーブル、ビュー、ストアドプロシージャの任意の組み合わせが表示されます。

はじめる準備はできましたか?

API Driver で Spotify のライブデータに接続

Spotify に接続