CData JDBC Driver を使用して Databricks を IBM WebSphere に接続

Anusha M B
Anusha M B
Technical Marketing Engineer
CData JDBC Driver を使用して Databricks を IBM WebSphere に接続し、シームレスなデータ連携を実現します。

IBM WebSphere は、多くのエンタープライズレベルの Java アプリケーションやサービスを実行する強力なアプリケーションサーバーです。CData JDBC Driver for Databricks と組み合わせることで、IBM WebSphere アプリケーションは複雑な API を使用せずに、標準 SQL クエリで Databricks に接続し、データを操作できます。これにより、連携作業の簡素化、開発工数の削減、重要なビジネスデータへの安全なリアルタイムアクセスが可能になります。

Databricks データ連携について

CData を使用すれば、Databricks のライブデータへのアクセスと統合がこれまでになく簡単になります。お客様は CData の接続機能を以下の目的で利用しています:

  • Runtime バージョン 9.1 - 13.X から Pro および Classic Databricks SQL バージョンまで、すべてのバージョンの Databricks にアクセスできます。
  • あらゆるホスティングソリューションとの互換性により、お好みの環境で Databricks を使用し続けることができます。
  • パーソナルアクセストークン、Azure サービスプリンシパル、Azure AD など、さまざまな方法で安全に認証できます。
  • Databricks ファイルシステム、Azure Blob ストレージ、AWS S3 ストレージを使用して Databricks にデータをアップロードできます。

多くのお客様が、さまざまなシステムから Databricks データレイクハウスにデータを移行するために CData のソリューションを使用していますが、ライブ接続ソリューションを使用して、データベースと Databricks 間の接続をフェデレートしているお客様も多数います。これらのお客様は、SQL Server リンクサーバーまたは Polybase を使用して、既存の RDBMS 内から Databricks へのライブアクセスを実現しています。

一般的な Databricks のユースケースと CData のソリューションがデータの問題解決にどのように役立つかについては、ブログをご覧ください:What is Databricks Used For? 6 Use Cases


はじめに


前提条件

  1. Databricks アカウントへのアクセス(API 権限付き)
  2. IBM WebSphere Application Server(構成済みで実行中)
  3. CData JDBC Driver for Databricks
  4. デプロイ用の Java Servlet WAR アプリケーション

Note: この記事では Salesforce をデモ用のデータソースとして使用していますが、同じ手順で CData が提供する 250 種類以上の JDBC Driver に接続できます。

はじめに

ステップ1:CData JDBC Driver for Databricks のダウンロードとインストール

CData JDBC Driver for Databricks をダウンロードしてインストールします。インストールすると .jar ファイルが提供されます:cdata.jdbc.databricks.jar

ステップ2:IBM WebSphere のインストールと構成

  1. IBM 公式サイトから IBM WebSphere のアカウントを作成します。
  2. IBM WebSphere Application Server のドキュメントを参照して、ローカルシステムに IBM WebSphere Application Server をインストール・構成します。
  3. アプリケーションサーバーのインストールが完了したら、ブラウザで管理コンソールを使用して WebSphere Server を起動します:https://your-server:9043/ibm/console

ステップ3:Databricks 用の JDBC プロバイダーとデータソースの設定

  1. Resources に移動し、JDBC セクションを展開して、JDBC providers を選択して新しいプロバイダーを作成します
  2. ドロップダウンメニューから適切なスコープを選択します
  3. New をクリックして JDBC プロバイダーを追加します
    • データベースタイプとして User defined を選択します
    • implementation class name として cdata.jdbc.databricks.DatabricksConnectionPoolDataSource を入力します
    • プロバイダーの名前を入力します(例:User defined JDBC Provider)
    • classpath フィールドに JDBC ドライバー JAR ファイルのフルパスを入力します
    • Next をクリックし、Finish をクリックして、マスター構成に変更を保存します
  4. JDBC プロバイダーが作成されたら、JDBC データソースを追加します。
    • Data Source NameJNDI name などの基本情報を入力します
    • 先ほど作成した JDBC provider を選択します(例:CData Databricks Provider)
    • Implementation class name を指定します:cdata.jdbc.databricks.DatabricksConnectionPoolDataSource
    • Data Store Helper Class Name を追加します:com.ibm.websphere.rsadapter.GenericDataStoreHelper
    • 必要に応じて authentication aliases を設定してセキュリティを構成します
    • Summary ページですべての詳細を確認し、Finish をクリックしてデータソースの作成を完了します
  5. 一覧から新しく作成したデータソースを選択し、Custom properties を開きます
  6. URL プロパティに JDBC 接続文字列を追加し、OK を押します。例:

    jdbc:databricks:RTK=5246...;Server=127.0.0.1;HTTPPath=MyHTTPPath;User=MyUser;Token=MyToken;

    Databricks 接続プロパティの取得・設定方法

    Databricks クラスターに接続するには、以下のプロパティを設定します。

    • Database:Databricks データベース名。
    • Server:Databricks クラスターのサーバーのホスト名
    • HTTPPath:Databricks クラスターのHTTP パス。
    • Token:個人用アクセストークン。この値は、Databricks インスタンスのユーザー設定ページに移動してアクセストークンタブを選択することで取得できます。
    Databricks インスタンスで必要な値は、クラスターに移動して目的のクラスターを選択し、Advanced Options の下にあるJDBC/ODBC タブを選択することで見つけることができます。

    Databricks への認証

    CData は、次の認証スキームをサポートしています。

    • 個人用アクセストークン
    • Microsoft Entra ID(Azure AD)
    • Azure サービスプリンシパル
    • OAuthU2M
    • OAuthM2M

    個人用アクセストークン

    認証するには、次を設定します。

    • AuthSchemePersonalAccessToken
    • Token:Databricks サーバーへの接続に使用するトークン。Databricks インスタンスのユーザー設定ページに移動してアクセストークンタブを選択することで取得できます。

    その他の認証方法については、ヘルプドキュメント の「はじめに」セクションを参照してください。

    組み込みの接続文字列デザイナー

    JDBC URL の作成には、Databricks JDBC Driver に組み込まれている接続文字列デザイナーを使用してください。JAR ファイルをダブルクリックするか、コマンドラインから JAR ファイルを実行します。

          java -jar cdata.jdbc.databricks.jar
          

    接続プロパティを入力し、接続文字列をクリップボードにコピーします。

    Note: URL プロパティが利用できない場合は、作成してから JDBC 接続文字列を追加してください。

    Tip: URL プロパティに入力する前に、必ずドライバーで接続文字列をテストしてください。
  7. データソースを開き、Test Connection を選択します

ステップ4:Web アプリケーションのビルド

  1. お好みの Java フレームワーク(Servlet、JSP、Spring)を使用して Web アプリケーションをビルドします。生成される .war ファイルは通常、次のような構造になります:
  2. 		DatabricksServletApp.war
    		|--webcontent
    		|  |--index.jsp                 -- JSP ページ(エントリーポイント)
    		|  |
    		|  |--WEB-INF/                  -- ブラウザから直接アクセス不可
    		|     |--web.xml                 -- デプロイメント記述子
    		|     |
    		|     |--classes/                  -- コンパイル済み .class ファイル
    		|       |--com/example/Databricks/
    		|          |--DatabricksServlet.class
    		|
    		|--lib/                      -- 依存 JAR ファイル
    		|--cdata.jdbc.databricks.jar
    	
  3. JDBC または JPA を使用してデータアクセスロジックを定義し、JNDI 名でデータソースを参照します
  4. この記事では、JDBC 接続の設定と Java Servlet アプリケーションのデプロイについて説明します
  5. プロジェクトを WAR(Web Application Archive)または EAR(Enterprise Archive)ファイルとしてパッケージ化してデプロイします
    • ターミナルで以下のコマンドを使用して Java ファイルをコンパイルします:
      			cd webcontent
      			jar cvf ..\DatabricksServletApp.war *
      		

ステップ5:WebSphere に Databricks アプリケーションをデプロイ

  1. WebSphere 管理コンソールで Applications に移動し、Install New Application を選択します
  2. WAR ファイルを参照してアップロードし、インストールウィザードを進めます。

ステップ6:WebSphere から Databricks のデータ を取得

  1. コンテキストルートを使用してアプリケーションにアクセスします:http://hostname:port/context-root/page
  2. Note: ブラウザで開く前に、デプロイしたアプリケーションが起動していることを確認してください。

これでソースから取得したデータを表示できるようになりました。データは IBM WebSphere を通じて直接アクセスできます。このセットアップは、Servlet を WebSphere にデプロイして JDBC ドライバーを使用して Databricks データを取得する方法を示しており、Databricks を活用した高度なエンタープライズアプリケーションを構築するための強固な基盤となります。

Databricks から IBM WebSphere への接続を始めましょう

CData JDBC Connector を使用して、今すぐ Databricks から IBM WebSphere への接続を始めましょう。30日間の無料トライアルをダウンロードして、アプリケーションへの安全でリアルタイムなデータアクセスがいかに簡単に実現できるかをお試しください。ご不明な点がございましたら、サポートチームがいつでもお手伝いします。

はじめる準備はできましたか?

Databricks Driver の無料トライアルをダウンロードしてお試しください:

 ダウンロード

詳細:

Databricks Icon Databricks JDBC Driver お問い合わせ

Databricks 連携のパワフルなJava アプリケーションを素早く作成して配布。