CData JDBC Driver を使用して Databricks を IBM WebSphere に接続
IBM WebSphere は、多くのエンタープライズレベルの Java アプリケーションやサービスを実行する強力なアプリケーションサーバーです。CData JDBC Driver for Databricks と組み合わせることで、IBM WebSphere アプリケーションは複雑な API を使用せずに、標準 SQL クエリで Databricks に接続し、データを操作できます。これにより、連携作業の簡素化、開発工数の削減、重要なビジネスデータへの安全なリアルタイムアクセスが可能になります。
Databricks データ連携について
CData を使用すれば、Databricks のライブデータへのアクセスと統合がこれまでになく簡単になります。お客様は CData の接続機能を以下の目的で利用しています:
- Runtime バージョン 9.1 - 13.X から Pro および Classic Databricks SQL バージョンまで、すべてのバージョンの Databricks にアクセスできます。
- あらゆるホスティングソリューションとの互換性により、お好みの環境で Databricks を使用し続けることができます。
- パーソナルアクセストークン、Azure サービスプリンシパル、Azure AD など、さまざまな方法で安全に認証できます。
- Databricks ファイルシステム、Azure Blob ストレージ、AWS S3 ストレージを使用して Databricks にデータをアップロードできます。
多くのお客様が、さまざまなシステムから Databricks データレイクハウスにデータを移行するために CData のソリューションを使用していますが、ライブ接続ソリューションを使用して、データベースと Databricks 間の接続をフェデレートしているお客様も多数います。これらのお客様は、SQL Server リンクサーバーまたは Polybase を使用して、既存の RDBMS 内から Databricks へのライブアクセスを実現しています。
一般的な Databricks のユースケースと CData のソリューションがデータの問題解決にどのように役立つかについては、ブログをご覧ください:What is Databricks Used For? 6 Use Cases
はじめに
前提条件
- Databricks アカウントへのアクセス(API 権限付き)
- IBM WebSphere Application Server(構成済みで実行中)
- CData JDBC Driver for Databricks
- デプロイ用の Java Servlet WAR アプリケーション
Note: この記事では Salesforce をデモ用のデータソースとして使用していますが、同じ手順で CData が提供する 250 種類以上の JDBC Driver に接続できます。
はじめに
ステップ1:CData JDBC Driver for Databricks のダウンロードとインストール
CData JDBC Driver for Databricks をダウンロードしてインストールします。インストールすると .jar ファイルが提供されます:cdata.jdbc.databricks.jar
ステップ2:IBM WebSphere のインストールと構成
- IBM 公式サイトから IBM WebSphere のアカウントを作成します。
- IBM WebSphere Application Server のドキュメントを参照して、ローカルシステムに IBM WebSphere Application Server をインストール・構成します。
- アプリケーションサーバーのインストールが完了したら、ブラウザで管理コンソールを使用して WebSphere Server を起動します:https://your-server:9043/ibm/console
ステップ3:Databricks 用の JDBC プロバイダーとデータソースの設定
- Resources に移動し、JDBC セクションを展開して、JDBC providers を選択して新しいプロバイダーを作成します
- ドロップダウンメニューから適切なスコープを選択します
- New をクリックして JDBC プロバイダーを追加します
- データベースタイプとして User defined を選択します
- implementation class name として cdata.jdbc.databricks.DatabricksConnectionPoolDataSource を入力します
- プロバイダーの名前を入力します(例:User defined JDBC Provider)
- classpath フィールドに JDBC ドライバー JAR ファイルのフルパスを入力します
- Next をクリックし、Finish をクリックして、マスター構成に変更を保存します
- JDBC プロバイダーが作成されたら、JDBC データソースを追加します。
- Data Source Name や JNDI name などの基本情報を入力します
- 先ほど作成した JDBC provider を選択します(例:CData Databricks Provider)
- Implementation class name を指定します:cdata.jdbc.databricks.DatabricksConnectionPoolDataSource
- Data Store Helper Class Name を追加します:com.ibm.websphere.rsadapter.GenericDataStoreHelper
- 必要に応じて authentication aliases を設定してセキュリティを構成します
- Summary ページですべての詳細を確認し、Finish をクリックしてデータソースの作成を完了します
- 一覧から新しく作成したデータソースを選択し、Custom properties を開きます
-
URL プロパティに JDBC 接続文字列を追加し、OK を押します。例:
jdbc:databricks:RTK=5246...;Server=127.0.0.1;HTTPPath=MyHTTPPath;User=MyUser;Token=MyToken;
Databricks 接続プロパティの取得・設定方法
Databricks クラスターに接続するには、以下のプロパティを設定します。
- Database:Databricks データベース名。
- Server:Databricks クラスターのサーバーのホスト名。
- HTTPPath:Databricks クラスターのHTTP パス。
- Token:個人用アクセストークン。この値は、Databricks インスタンスのユーザー設定ページに移動してアクセストークンタブを選択することで取得できます。
Databricks への認証
CData は、次の認証スキームをサポートしています。
- 個人用アクセストークン
- Microsoft Entra ID(Azure AD)
- Azure サービスプリンシパル
- OAuthU2M
- OAuthM2M
個人用アクセストークン
認証するには、次を設定します。
- AuthScheme:PersonalAccessToken。
- Token:Databricks サーバーへの接続に使用するトークン。Databricks インスタンスのユーザー設定ページに移動してアクセストークンタブを選択することで取得できます。
その他の認証方法については、ヘルプドキュメント の「はじめに」セクションを参照してください。
組み込みの接続文字列デザイナー
JDBC URL の作成には、Databricks JDBC Driver に組み込まれている接続文字列デザイナーを使用してください。JAR ファイルをダブルクリックするか、コマンドラインから JAR ファイルを実行します。
java -jar cdata.jdbc.databricks.jar接続プロパティを入力し、接続文字列をクリップボードにコピーします。
Note: URL プロパティが利用できない場合は、作成してから JDBC 接続文字列を追加してください。
Tip: URL プロパティに入力する前に、必ずドライバーで接続文字列をテストしてください。
- データソースを開き、Test Connection を選択します
ステップ4:Web アプリケーションのビルド
- お好みの Java フレームワーク(Servlet、JSP、Spring)を使用して Web アプリケーションをビルドします。生成される .war ファイルは通常、次のような構造になります:
- JDBC または JPA を使用してデータアクセスロジックを定義し、JNDI 名でデータソースを参照します
- この記事では、JDBC 接続の設定と Java Servlet アプリケーションのデプロイについて説明します
- プロジェクトを WAR(Web Application Archive)または EAR(Enterprise Archive)ファイルとしてパッケージ化してデプロイします
- ターミナルで以下のコマンドを使用して Java ファイルをコンパイルします:
cd webcontent jar cvf ..\DatabricksServletApp.war *
DatabricksServletApp.war |--webcontent | |--index.jsp -- JSP ページ(エントリーポイント) | | | |--WEB-INF/ -- ブラウザから直接アクセス不可 | |--web.xml -- デプロイメント記述子 | | | |--classes/ -- コンパイル済み .class ファイル | |--com/example/Databricks/ | |--DatabricksServlet.class | |--lib/ -- 依存 JAR ファイル |--cdata.jdbc.databricks.jar
ステップ5:WebSphere に Databricks アプリケーションをデプロイ
- WebSphere 管理コンソールで Applications に移動し、Install New Application を選択します
- WAR ファイルを参照してアップロードし、インストールウィザードを進めます。
ステップ6:WebSphere から Databricks のデータ を取得
- コンテキストルートを使用してアプリケーションにアクセスします:http://hostname:port/context-root/page
Note: ブラウザで開く前に、デプロイしたアプリケーションが起動していることを確認してください。
これでソースから取得したデータを表示できるようになりました。データは IBM WebSphere を通じて直接アクセスできます。このセットアップは、Servlet を WebSphere にデプロイして JDBC ドライバーを使用して Databricks データを取得する方法を示しており、Databricks を活用した高度なエンタープライズアプリケーションを構築するための強固な基盤となります。
Databricks から IBM WebSphere への接続を始めましょう
CData JDBC Connector を使用して、今すぐ Databricks から IBM WebSphere への接続を始めましょう。30日間の無料トライアルをダウンロードして、アプリケーションへの安全でリアルタイムなデータアクセスがいかに簡単に実現できるかをお試しください。ご不明な点がございましたら、サポートチームがいつでもお手伝いします。