CData JDBC Driver を使用して Hive を IBM WebSphere に接続

Anusha M B
Anusha M B
Technical Marketing Engineer
CData JDBC Driver を使用して Hive を IBM WebSphere に接続し、シームレスなデータ連携を実現します。

IBM WebSphere は、多くのエンタープライズレベルの Java アプリケーションやサービスを実行する強力なアプリケーションサーバーです。CData JDBC Driver for Apache Hive と組み合わせることで、IBM WebSphere アプリケーションは複雑な API を使用せずに、標準 SQL クエリで Hive に接続し、データを操作できます。これにより、連携作業の簡素化、開発工数の削減、重要なビジネスデータへの安全なリアルタイムアクセスが可能になります。

前提条件

  1. Hive アカウントへのアクセス(API 権限付き)
  2. IBM WebSphere Application Server(構成済みで実行中)
  3. CData JDBC Driver for Apache Hive
  4. デプロイ用の Java Servlet WAR アプリケーション

Note: この記事では Salesforce をデモ用のデータソースとして使用していますが、同じ手順で CData が提供する 250 種類以上の JDBC Driver に接続できます。

はじめに

ステップ1:CData JDBC Driver for Apache Hive のダウンロードとインストール

CData JDBC Driver for Apache Hive をダウンロードしてインストールします。インストールすると .jar ファイルが提供されます:cdata.jdbc.apachehive.jar

ステップ2:IBM WebSphere のインストールと構成

  1. IBM 公式サイトから IBM WebSphere のアカウントを作成します。
  2. IBM WebSphere Application Server のドキュメントを参照して、ローカルシステムに IBM WebSphere Application Server をインストール・構成します。
  3. アプリケーションサーバーのインストールが完了したら、ブラウザで管理コンソールを使用して WebSphere Server を起動します:https://your-server:9043/ibm/console

ステップ3:Hive 用の JDBC プロバイダーとデータソースの設定

  1. Resources に移動し、JDBC セクションを展開して、JDBC providers を選択して新しいプロバイダーを作成します
  2. ドロップダウンメニューから適切なスコープを選択します
  3. New をクリックして JDBC プロバイダーを追加します
    • データベースタイプとして User defined を選択します
    • implementation class name として cdata.jdbc.apachehive.ApacheHiveConnectionPoolDataSource を入力します
    • プロバイダーの名前を入力します(例:User defined JDBC Provider)
    • classpath フィールドに JDBC ドライバー JAR ファイルのフルパスを入力します
    • Next をクリックし、Finish をクリックして、マスター構成に変更を保存します
  4. JDBC プロバイダーが作成されたら、JDBC データソースを追加します。
    • Data Source NameJNDI name などの基本情報を入力します
    • 先ほど作成した JDBC provider を選択します(例:CData Hive Provider)
    • Implementation class name を指定します:cdata.jdbc.apachehive.ApacheHiveConnectionPoolDataSource
    • Data Store Helper Class Name を追加します:com.ibm.websphere.rsadapter.GenericDataStoreHelper
    • 必要に応じて authentication aliases を設定してセキュリティを構成します
    • Summary ページですべての詳細を確認し、Finish をクリックしてデータソースの作成を完了します
  5. 一覧から新しく作成したデータソースを選択し、Custom properties を開きます
  6. URL プロパティに JDBC 接続文字列を追加し、OK を押します。例:

    jdbc:apachehive:RTK=5246...;Server=127.0.0.1;Port=10000;TransportMode=BINARY;

    Apache Hive への接続を確立するには以下を指定します。

    • Server:HiveServer2 をホストするサーバーのホスト名またはIP アドレスに設定。
    • Port:HiveServer2 インスタンスへの接続用のポートに設定。
    • TransportMode:Hive サーバーとの通信に使用するトランスポートモード。有効な入力値は、BINARY およびHTTP です。デフォルトではBINARY が選択されます。
    • AuthScheme:使用される認証スキーム。有効な入力値はPLAIN、LDAP、NOSASL、およびKERBEROS です。デフォルトではPLAIN が選択されます。
    • CData 製品においてTLS/SSL を有効化するには、UseSSL をTrue に設定します

    組み込みの接続文字列デザイナー

    JDBC URL の作成には、Hive JDBC Driver に組み込まれている接続文字列デザイナーを使用してください。JAR ファイルをダブルクリックするか、コマンドラインから JAR ファイルを実行します。

          java -jar cdata.jdbc.apachehive.jar
          

    接続プロパティを入力し、接続文字列をクリップボードにコピーします。

    Note: URL プロパティが利用できない場合は、作成してから JDBC 接続文字列を追加してください。

    Tip: URL プロパティに入力する前に、必ずドライバーで接続文字列をテストしてください。
  7. データソースを開き、Test Connection を選択します

ステップ4:Web アプリケーションのビルド

  1. お好みの Java フレームワーク(Servlet、JSP、Spring)を使用して Web アプリケーションをビルドします。生成される .war ファイルは通常、次のような構造になります:
  2. 		HiveServletApp.war
    		|--webcontent
    		|  |--index.jsp                 -- JSP ページ(エントリーポイント)
    		|  |
    		|  |--WEB-INF/                  -- ブラウザから直接アクセス不可
    		|     |--web.xml                 -- デプロイメント記述子
    		|     |
    		|     |--classes/                  -- コンパイル済み .class ファイル
    		|       |--com/example/Hive/
    		|          |--HiveServlet.class
    		|
    		|--lib/                      -- 依存 JAR ファイル
    		|--cdata.jdbc.hive.jar
    	
  3. JDBC または JPA を使用してデータアクセスロジックを定義し、JNDI 名でデータソースを参照します
  4. この記事では、JDBC 接続の設定と Java Servlet アプリケーションのデプロイについて説明します
  5. プロジェクトを WAR(Web Application Archive)または EAR(Enterprise Archive)ファイルとしてパッケージ化してデプロイします
    • ターミナルで以下のコマンドを使用して Java ファイルをコンパイルします:
      			cd webcontent
      			jar cvf ..\HiveServletApp.war *
      		

ステップ5:WebSphere に Hive アプリケーションをデプロイ

  1. WebSphere 管理コンソールで Applications に移動し、Install New Application を選択します
  2. WAR ファイルを参照してアップロードし、インストールウィザードを進めます。

ステップ6:WebSphere から Hive のデータ を取得

  1. コンテキストルートを使用してアプリケーションにアクセスします:http://hostname:port/context-root/page
  2. Note: ブラウザで開く前に、デプロイしたアプリケーションが起動していることを確認してください。

これでソースから取得したデータを表示できるようになりました。データは IBM WebSphere を通じて直接アクセスできます。このセットアップは、Servlet を WebSphere にデプロイして JDBC ドライバーを使用して Hive データを取得する方法を示しており、Hive を活用した高度なエンタープライズアプリケーションを構築するための強固な基盤となります。

Hive から IBM WebSphere への接続を始めましょう

CData JDBC Connector を使用して、今すぐ Hive から IBM WebSphere への接続を始めましょう。30日間の無料トライアルをダウンロードして、アプリケーションへの安全でリアルタイムなデータアクセスがいかに簡単に実現できるかをお試しください。ご不明な点がございましたら、サポートチームがいつでもお手伝いします。

はじめる準備はできましたか?

Apache Hive Driver の無料トライアルをダウンロードしてお試しください:

 ダウンロード

詳細:

Apache Hive Icon Apache Hive JDBC Driver お問い合わせ

Apache Hive 互換ディストリビューション連携のパワフルなJava アプリケーションを素早く作成して配布。