HULFT Integrate で Presto のデータ に接続

Jerod Johnson
Jerod Johnson
Director, Technology Evangelism
HULFT Integrate で Presto に JDBC データソースとして接続

HULFT Integrate は、ドラッグ&ドロップのユーザーインターフェースでコーポレーションフロー、データ変換、処理を簡単に作成できる最新のデータ連携プラットフォームです。CData JDBC Driver for Presto と組み合わせることで、HULFT Integrate からリアルタイムの Presto のデータ を扱うことができます。この記事では、Presto への接続方法と、データを CSV ファイルに出力する手順をご紹介します。

CData JDBC ドライバーは、最適化されたデータ処理機能を備えており、リアルタイムの Presto のデータ との連携において比類のないパフォーマンスを発揮します。Presto に対して複雑な SQL クエリを発行すると、ドライバーはフィルタや集計などのサポートされている SQL 操作を直接 Presto にプッシュし、サポートされていない操作(主に SQL 関数や JOIN 操作)は内蔵の SQL エンジンでクライアント側で処理します。また、動的なメタデータクエリ機能により、ネイティブなデータ型を使用して Presto のデータ を操作・分析できます。

Presto データ連携について

CData を使用すれば、Trino および Presto SQL エンジンのライブデータへのアクセスと統合がこれまでになく簡単になります。お客様は CData の接続機能を以下の目的で利用しています:

  • Trino v345 以降(旧 PrestoSQL)および Presto v0.242 以降(旧 PrestoDB)のデータにアクセスできます。
  • Trino または Presto インスタンスの基盤となるすべてのデータに対して読み取り・書き込みアクセスができます。
  • 最大スループットのための最適化されたクエリ生成。

Presto と Trino により、ユーザーは単一のエンドポイントを通じてさまざまな基盤データソースにアクセスできます。CData の接続と組み合わせることで、ユーザーはインスタンスへの純粋な SQL-92 アクセスを取得し、ビジネスデータをデータウェアハウスに統合したり、Power BI や Tableau などのお気に入りのツールからライブデータに直接簡単にアクセスしたりできます。

多くの場合、CData のライブ接続は、ツールで利用可能なネイティブのインポート機能を上回ります。あるお客様は、レポートに必要なデータセットのサイズが大きいため、Power BI を効果的に使用できませんでした。同社が CData Power BI Connector for Presto を導入したところ、DirectQuery 接続モードを使用してリアルタイムでレポートを生成できるようになりました。


はじめに


Presto へのアクセスを有効化

HULFT Integrate プロジェクトから Presto のデータ へのアクセスを有効にするには、以下の手順で設定します:

  1. CData JDBC Driver の JAR ファイル(およびライセンスファイルがある場合はそれも)、cdata.jdbc.presto.jar(および cdata.jdbc.presto.lic)を、Integrate Server の jdbc_adapter サブフォルダにコピーします
  2. HULFT Integrate Server を再起動し、HULFT Integrate Studio を起動します

Presto のデータ にアクセスするプロジェクトの作成

JAR ファイルをコピーしたら、Presto のデータ にアクセスするプロジェクトを作成できます。まず、Integrate Studio を開いて新しいプロジェクトを作成しましょう。

  1. プロジェクト名を入力します
  2. 「スクリプトを作成」チェックボックスがオンになっていることを確認します
  3. 「次へ」をクリックします
  4. スクリプト名を入力します(例:PrestotoCSV)

プロジェクトを作成したら、Presto のデータ を CSV ファイルにコピーするためのコンポーネントをスクリプトに追加します。

Execute Select SQL コンポーネントの設定

ツールパレット(Database -> JDBC)から「Execute Select SQL」コンポーネントをスクリプトワークスペースにドラッグします。

  1. 「必須設定」タブの接続先で、「追加」をクリックして Presto 用の新しい接続を作成します。以下のプロパティを設定します:
    • 名前:Presto Connection Settings
    • ドライバークラス名:cdata.jdbc.presto.PrestoDriver
    • URL:jdbc:presto:Server=127.0.0.1;Port=8080;

      組み込みの接続文字列デザイナー

      JDBC URL の構築には、Presto JDBC Driver に組み込まれている接続文字列デザイナーをご利用ください。JAR ファイルをダブルクリックするか、コマンドラインから JAR ファイルを実行します。

      		java -jar cdata.jdbc.presto.jar
      		

      接続プロパティを入力し、接続文字列をクリップボードにコピーします。

      Presto への接続には、まずはServer およびPort を接続プロパティとして設定します。それ以外の追加項目は接続方式によって異なります。

      TLS/SSL を有効化するには、UseSSL をTRUE に設定します。

      LDAP で認証

      LDAP で認証するには、次の接続プロパティを設定します:

      • AuthScheme: LDAP に設定。
      • User: LDAP で接続するユーザー名。
      • Password: LDAP で接続するユーザーのパスワード。

      Kerberos 認証

      KERBEROS 認証を使う場合には、以下を設定します:

      • AuthScheme: KERBEROS に設定。
      • KerberosKDC: 接続するユーザーのKerberos Key Distribution Center (KDC) サービス。
      • KerberosRealm: 接続するユーザーのKerberos Realm 。
      • KerberosSPN: Kerberos Domain Controller のService Principal Name。
      • KerberosKeytabFile: Kerberos principals とencrypted keys を含むKeytab file。
      • User: Kerberos のユーザー。
      • Password: Kerberos で認証するユーザーのパスワード。
  2. SQL ステートメントを記述します。例:
    SELECT FirstName, LastName FROM Customer
  3. 「抽出テスト」をクリックして、接続とクエリが正しく設定されていることを確認します
  4. 「SQL を実行して出力スキーマを設定」をクリックします
  5. 「完了」をクリックします

Write CSV File コンポーネントの設定

ツールパレット(File -> CSV)から「Write CSV File」コンポーネントをワークスペースにドラッグします。

  1. クエリ結果を書き込むファイルを設定します(例:Customer.csv)
  2. 「入力データ」を「Select SQL」コンポーネントに設定します
  3. SQL クエリで選択した各フィールドのカラムを追加します
  4. 「書き込み設定」タブで、「最初の行にカラム名を挿入する」チェックボックスをオンにします
  5. 「完了」をクリックします

Presto フィールドを CSV カラムにマッピング

「Select」コンポーネントの各カラムを、「CSV」コンポーネントの対応するカラムにマッピングします。

スクリプトの完成

「Start」コンポーネントを「Select」コンポーネントに、「CSV」コンポーネントを「End」コンポーネントにドラッグして接続します。スクリプトをビルドして実行すると、Presto のデータ が CSV ファイルに出力されます。

CData JDBC Driver for Prestoの30日間の無償トライアルをダウンロードして、HULFT Integrate でリアルタイムの Presto のデータ を活用してみてください。ご不明な点があれば、サポートチームまでお気軽にお問い合わせください。

はじめる準備はできましたか?

Presto Driver の無料トライアルをダウンロードしてお試しください:

 ダウンロード

詳細:

Presto Icon Presto JDBC Driver お問い合わせ

Presto に連携するJava アプリケーションを素早く、簡単に開発できる便利なドライバー。