HULFT Integrate で Redshift のデータに接続

Jerod Johnson
Senior Technology Evangelist

HULFT Integrate で Redshift に JDBC データソースとして接続

HULFT Integrate は、ドラッグ＆ドロップのユーザーインターフェースでコーポレーションフロー、データ変換、処理を簡単に作成できる最新のデータ連携プラットフォームです。CData JDBC Driver for Amazon Redshift と組み合わせることで、HULFT Integrate からリアルタイムの Redshift のデータを扱うことができます。この記事では、Redshift への接続方法と、データを CSV ファイルに出力する手順をご紹介します。

CData JDBC ドライバーは、最適化されたデータ処理機能を備えており、リアルタイムの Redshift のデータとの連携において比類のないパフォーマンスを発揮します。Redshift に対して複雑な SQL クエリを発行すると、ドライバーはフィルタや集計などのサポートされている SQL 操作を直接 Redshift にプッシュし、サポートされていない操作（主に SQL 関数や JOIN 操作）は内蔵の SQL エンジンでクライアント側で処理します。また、動的なメタデータクエリ機能により、ネイティブなデータ型を使用して Redshift のデータを操作・分析できます。

Redshift へのアクセスを有効化

HULFT Integrate プロジェクトから Redshift のデータへのアクセスを有効にするには、以下の手順で設定します：

CData JDBC Driver の JAR ファイル（およびライセンスファイルがある場合はそれも）、cdata.jdbc.redshift.jar（および cdata.jdbc.redshift.lic）を、Integrate Server の jdbc_adapter サブフォルダにコピーします
HULFT Integrate Server を再起動し、HULFT Integrate Studio を起動します

Redshift のデータにアクセスするプロジェクトの作成

JAR ファイルをコピーしたら、Redshift のデータにアクセスするプロジェクトを作成できます。まず、Integrate Studio を開いて新しいプロジェクトを作成しましょう。

プロジェクト名を入力します
「スクリプトを作成」チェックボックスがオンになっていることを確認します
「次へ」をクリックします
スクリプト名を入力します（例：RedshifttoCSV）

プロジェクトを作成したら、Redshift のデータを CSV ファイルにコピーするためのコンポーネントをスクリプトに追加します。

Execute Select SQL コンポーネントの設定

ツールパレット（Database -> JDBC）から「Execute Select SQL」コンポーネントをスクリプトワークスペースにドラッグします。

「必須設定」タブの接続先で、「追加」をクリックして Redshift 用の新しい接続を作成します。以下のプロパティを設定します：
- 名前：Redshift Connection Settings
- ドライバークラス名：cdata.jdbc.redshift.RedshiftDriver
- URL：jdbc:redshift:User=admin;Password=admin;Database=dev;Server=examplecluster.my.us-west-2.redshift.amazonaws.com;Port=5439;
  
  組み込みの接続文字列デザイナー
  
  JDBC URL の構築には、Redshift JDBC Driver に組み込まれている接続文字列デザイナーをご利用ください。JAR ファイルをダブルクリックするか、コマンドラインから JAR ファイルを実行します。
```
		java -jar cdata.jdbc.redshift.jar
		
```
  接続プロパティを入力し、接続文字列をクリップボードにコピーします。
  
  Amazon Redshift への接続
  
  それでは、早速Amazon Redshift に接続していきましょう。データに接続するには、以下の接続パラメータを指定します。
  - Server：Amazon Redshift データベースをホスティングしているサーバーのホスト名またはIP アドレス
  - Database：Amazon Redshift クラスター用に作成したデータベース
  - Port（オプション）：Amazon Redshift データベースをホスティングしているサーバーのポート。デフォルトは5439です
  これらの値は、以下のステップでAWS マネージメントコンソールから取得できます。
  1. Amazon Redshift コンソールを開きます（http://console.aws.amazon.com/redshift）
  2. Clusters ページで、クラスター名をクリックしてください
  3. Configuration タブの"Cluster Database Properties" セクションからプロパティを取得します。接続プロパティの値は、ODBC URL で設定された値と同じになります
  Amazon Redshiftへの認証
  CData 製品では幅広い認証オプションに対応しています。標準認証情報からIAM クレデンシャル、ADFS、Ping Federate、Microsoft Entra ID（Azure AD）、Azure AD PKCE まで利用可能です。
  標準認証
  ログイン資格情報を使用してAmazon Redshift に接続するには、以下のプロパティを設定してみましょう。
  - AuthScheme：Basic
  - User：認証するユーザーのログイン情報
  - Password：認証するユーザーのパスワード
  その他の認証方法については、ヘルプドキュメントをご確認ください。
SQL ステートメントを記述します。例：
```
SELECT ShipName, ShipCity FROM Orders
```
「抽出テスト」をクリックして、接続とクエリが正しく設定されていることを確認します
「SQL を実行して出力スキーマを設定」をクリックします
「完了」をクリックします

Write CSV File コンポーネントの設定

ツールパレット（File -> CSV）から「Write CSV File」コンポーネントをワークスペースにドラッグします。

クエリ結果を書き込むファイルを設定します（例：Orders.csv）
「入力データ」を「Select SQL」コンポーネントに設定します
SQL クエリで選択した各フィールドのカラムを追加します
「書き込み設定」タブで、「最初の行にカラム名を挿入する」チェックボックスをオンにします
「完了」をクリックします

Redshift フィールドを CSV カラムにマッピング

「Select」コンポーネントの各カラムを、「CSV」コンポーネントの対応するカラムにマッピングします。

スクリプトの完成

「Start」コンポーネントを「Select」コンポーネントに、「CSV」コンポーネントを「End」コンポーネントにドラッグして接続します。スクリプトをビルドして実行すると、Redshift のデータが CSV ファイルに出力されます。

CData JDBC Driver for Amazon Redshiftの30日間の無償トライアルをダウンロードして、HULFT Integrate でリアルタイムの Redshift のデータを活用してみてください。ご不明な点があれば、サポートチームまでお気軽にお問い合わせください。

はじめる準備はできましたか？

Amazon Redshift Driver の無料トライアルをダウンロードしてお試しください：

ダウンロード

詳細：

Amazon Redshift JDBC Driver お問い合わせ

Amazon Redshift データ連携のパワフルなJava アプリケーションを素早く作成して配布。

HULFT Integrate で Redshift のデータに接続

Redshift へのアクセスを有効化