Dremio でSpotify のデータに外部ソースとして接続

Jerod Johnson
Jerod Johnson
Director, Technology Evangelism
CData JDBC Driver を使用して、Dremio でSpotify に外部ソースとして接続します。

CData API Driver for JDBC はJDBC 標準を実装しており、Dremio を含むさまざまなアプリケーションでリアルタイムのSpotify のデータを扱えるようにします。Dremio は、データレイク上でのセルフサービス型インタラクティブ分析を実現するために設計されたデータレイクハウスプラットフォームです。CData JDBC ドライバーを使用することで、エンタープライズデータレイクの一部としてリアルタイムSpotify のデータを活用できます。この記事では、Dremio でSpotify のデータに外部ソースとして接続する方法について説明します。

CData JDBC Driver を使用すると、Dremio でリアルタイムSpotify のデータへの高速アクセスが可能になります。ドライバーをインストールしてSpotify で認証すれば、データレイク内でSpotify のデータにすぐにアクセスできます。ネイティブのデータ型を使用してSpotify のデータを表示し、複雑なフィルタ、集計、その他の操作を自動的に処理することで、CData JDBC Driver はSpotify のデータへのシームレスなアクセスを提供します。

前提条件

この記事では、Docker を使用して Dremio を実行することを想定しています。以下のようなコマンドで Dremio サービスを含む Docker コンテナを作成できます。

docker run -d --name dremio -p 9047:9047 -p 31010:31010 dremio/dremio-oss

ここで、dremio はコンテナの名前、9047 は Dremio Web インターフェース用のコンテナポート、31010 は Dremio クエリサービスにマッピングされるポートです。dremio/dremio-oss は使用するイメージを指定します。

ARP コネクタのビルド

CData JDBC Driver を Dremio で使用するには、Advanced Relation Pushdown(ARP)コネクタをビルドする必要があります。GitHub でソースコードを確認するか、ZIP ファイル(GitHub.com)を直接ダウンロードできます。ファイルをコピーまたは展開したら、コネクタのルートディレクトリ(pom.xml ファイルがあるディレクトリ)から以下のコマンドを実行してコネクタをビルドします。

mvn clean install

NOTE:CData ARP コネクタは Java 11 でコンパイルするようにビルドされています。Java 11 をインストールし、正しいバージョンを使用していることを確認してください。以下のようなコマンドで Java バージョンを更新できます。

sudo update-alternatives --config java

コネクタ用の JAR ファイルが(target ディレクトリに)ビルドされたら、ARP コネクタと JDBC Driver を Dremio インスタンスにコピーする準備が整いました。

コネクタと JDBC Driver のインストール

ARP コネクタを %DREMIO_HOME%/jars/ に、Spotify 用の JDBC Driver を %DREMIO_HOME%/jars/3rdparty にインストールします。以下のようなコマンドを使用できます。

ARP コネクタ

docker cp PATH\TO\dremio-api-plugin-{DREMIO_VERSION}.jar dremio_image_name:/opt/dremio/jars/

Spotify 用 JDBC Driver

docker cp PATH\TO\cdata.jdbc.api.jar dremio_image_name:/opt/dremio/jars/3rdparty/

Spotify への接続

これで、Dremio の外部ソースオプションに Spotify が表示されるようになりました。ビルドした ARP コネクタは、JDBC URL を使用してSpotify のデータに接続します。JDBC Driver には、接続文字列を作成できるビルトインの接続文字列デザイナーがあります(以下を参照)。

ビルトイン接続文字列デザイナー

JDBC URL の構成については、Spotify JDBC Driver に組み込まれている接続文字列デザイナーを使用してください。JAR ファイルをダブルクリックするか、コマンドラインから JAR ファイルを実行します。

java -jar cdata.jdbc.api.jar

接続プロパティを入力し、接続文字列をクリップボードにコピーします。

OAuth 認証の設定

Spotify は認証に OAuth 2.0 を使用します。クライアント認証情報を取得するには、Spotify Developer Dashboard でアプリケーションを作成する必要があります。

Spotify アプリケーションのセットアップ

  1. Spotify Developer Dashboard にアクセスします。
  2. Spotify アカウントでログインして Create app をクリックします。
  3. アプリ名、説明を入力し、Redirect URI を設定します(デスクトップアプリケーションの場合は
    http://localhost:33333
    など)。
  4. アプリ設定から Client IDClient Secret をコピーします。

接続プロパティ

以下の接続プロパティを設定して接続を確立してください:

  • AuthScheme:OAuth に設定します。
  • InitiateOAuthGETANDREFRESH に設定します。InitiateOAuth を使うと、OAuthAccessToken を取得するプロセスを管理できます。
  • OAuthClientId:Spotify アプリケーションの Client ID に設定します。
  • OAuthClientSecret:Spotify アプリケーションの Client Secret に設定します。
  • Scope:必要な OAuth スコープ(スペース区切り)に設定します。デフォルトには、このプロファイルのテーブルに必要なすべての読み取りスコープが含まれます。
  • CallbackURL:Spotify アプリケーションで設定したリダイレクト URI に設定します(例:http://localhost:33333)。

接続文字列の例

Profile=C:\profiles\Spotify.apip;AuthScheme=OAuth;InitiateOAuth=GETANDREFRESH;OAuthClientId=your_client_id;OAuthClientSecret=your_client_secret;CallbackURL=http://localhost:33333;

利用可能な OAuth スコープ

  • user-read-private:ユーザーのサブスクリプション詳細と露骨なコンテンツ設定への読み取りアクセス。
  • user-read-email:ユーザーのメールアドレスへの読み取りアクセス。
  • user-library-read:ユーザーが保存したトラック、アルバム、エピソード、ショー、オーディオブックへの読み取りアクセス。
  • playlist-read-private:ユーザーの非公開プレイリストへの読み取りアクセス。
  • playlist-read-collaborative:ユーザーがフォローしているコラボレーティブプレイリストへの読み取りアクセス。
  • user-follow-read:現在のユーザーがフォローしているアーティストの一覧への読み取りアクセス。
  • user-read-playback-state:ユーザーのプレーヤー状態(デバイス、現在のトラック、再生位置)への読み取りアクセス。
  • user-read-currently-playing:ユーザーが現在再生中のコンテンツへの読み取りアクセス。
  • user-read-playback-history:ユーザーが最近再生したトラックへの読み取りアクセス。
  • user-top-read:ユーザーのトップアーティストとトラックへの読み取りアクセス。

NOTE:Dremio で JDBC Driver を使用するには、ライセンス(正式版または評価版)とランタイムキー(RTK)が必要です。このライセンス(または評価版)の取得については、営業チームにお問い合わせください

ランタイムキー(RTK)を JDBC URL に追加します。最終的に、以下のような JDBC URL になります。

jdbc:api:RTK=5246...;Profile=C:\profiles\Spotify.apip;AuthScheme=OAuth;InitiateOAuth=GETANDREFRESH;OAuthClientId=your_client_id;OAuthClientSecret=your_client_secret;CallbackURL=http://localhost:33333;

Spotify に外部ソースとしてアクセス

Spotify を外部ソースとして追加するには、新しいソースを追加するためにクリックし、API を選択します。JDBC URL をコピーして、New API Source ウィザードに貼り付けます。

接続を保存すれば、Dremio でリアルタイムSpotify のデータをクエリする準備が整い、Spotify のデータをデータレイクに簡単に取り込むことができます。

詳細情報と無償トライアル

Dremio で CData API Driver for JDBC を使用すると、リアルタイムSpotify のデータをデータレイクに取り込むことができます。Spotify への接続の詳細については、CData API Driver for JDBC ページをご覧ください。CData API Driver for JDBC の30日間無償トライアルをダウンロードして、今すぐ始めましょう。

はじめる準備はできましたか?

API Driver で Spotify のライブデータに接続

Spotify に接続