Node.js で Hive のデータを MySQL データベースとしてクエリ

Jerod Johnson
Jerod Johnson
Senior Technology Evangelist
Node.js からHive のデータに対して MySQL クエリを実行する方法を紹介します。

Hive 用の ODBC Driver の SQL Gateway を使用すると、MySQL インターフェース経由でHive のデータをクエリできます。以下の手順に従って、SQL Gateway の MySQL リモーティングサービスを起動し、Node.js からクエリを開始してください。

Hive のデータに接続

まだ行っていない場合は、データソース名(DSN)で必要な接続プロパティの値を指定してください。組み込みの Microsoft ODBC データソースアドミニストレーターを使用して DSN を設定できます。これはドライバーインストールの最後のステップでもあります。Microsoft ODBC データソースアドミニストレーターを使用して DSN を作成・設定する方法については、ヘルプドキュメントの「はじめに」の章を参照してください。

Apache Hive への接続を確立するには以下を指定します。

  • Server:HiveServer2 をホストするサーバーのホスト名またはIP アドレスに設定。
  • Port:HiveServer2 インスタンスへの接続用のポートに設定。
  • TransportMode:Hive サーバーとの通信に使用するトランスポートモード。有効な入力値は、BINARY およびHTTP です。デフォルトではBINARY が選択されます。
  • AuthScheme:使用される認証スキーム。有効な入力値はPLAIN、LDAP、NOSASL、およびKERBEROS です。デフォルトではPLAIN が選択されます。
  • CData 製品においてTLS/SSL を有効化するには、UseSSL をTrue に設定します

SQL Gateway を設定

SQL Gateway 概要を参照して、Hive のデータ を仮想 MySQL データベースとして接続を設定してください。クライアントからの MySQL リクエストをリッスンする MySQL リモーティングサービスを設定します。サービスは SQL Gateway UI で設定できます。

SQL Gateway で MySQL リモーティングサービスを作成(Salesforce の例)

Node.js から Hive をクエリ

以下の例では、mysql モジュールを使用して Hive への接続を定義し、クエリを実行する方法を示しています。以下の情報が必要です。

  • ホスト名またはアドレス、およびポート:MySQL リモーティングサービスが MySQL 接続をリッスンしているマシンとポート
  • ユーザー名パスワード:SQL Gateway の Users タブで認証したユーザーのユーザー名とパスワード
  • データベース名:MySQL リモーティングサービス用に設定した DSN

以下のコードでHive のデータに接続し、クエリの実行を開始できます。

var mysql      = require('mysql');
var connection = mysql.createConnection({
  host     : 'localhost',
  database : 'CData ApacheHive Sys',
  port	   : '3306',
  user     : 'mysql_user',
  password : 'test'
});
connection.connect();
connection.query('SELECT * FROM Customers', function(err, rows, fields) {
  if (err) throw err;
  console.log(rows);
});

connection.end();

はじめる準備はできましたか?

Apache Hive ODBC Driver の無料トライアルをダウンロードしてお試しください:

 ダウンロード

詳細:

Apache Hive Icon Apache Hive ODBC Driver お問い合わせ

Hive ODBC Driver は、ODBC 接続をサポートする任意のアプリケーションからApache Hive データに直接接続できるパワフルなツールです。

ドライバーはSQL をHiveQL にマッピングして、標準SQL-92 で直接Apache Hive にアクセスできます。