CData SSIS Components を使用して SQL Server から Presto レコードを新規挿入または既存を更新
SQL Server データベースは、エンタープライズレコードの保存に広く使用されています。このデータを他の場所に移動する必要がある場合がよくあります。CData SSIS Components for Presto を使用すると、SQL Server から Presto にデータを簡単に転送できます。
この記事では、CData SSIS Components for Presto を SQL Server Integration Services ワークフロー内で使用して、SQL Server から Presto にデータをエクスポートする方法を説明します。ルックアップコンポーネントを活用して、既存のレコードを検索・更新するか、新しいレコードを挿入します。
Presto データ連携について
CData を使用すれば、Trino および Presto SQL エンジンのライブデータへのアクセスと統合がこれまでになく簡単になります。お客様は CData の接続機能を以下の目的で利用しています:
- Trino v345 以降(旧 PrestoSQL)および Presto v0.242 以降(旧 PrestoDB)のデータにアクセスできます。
- Trino または Presto インスタンスの基盤となるすべてのデータに対して読み取り・書き込みアクセスができます。
- 最大スループットのための最適化されたクエリ生成。
Presto と Trino により、ユーザーは単一のエンドポイントを通じてさまざまな基盤データソースにアクセスできます。CData の接続と組み合わせることで、ユーザーはインスタンスへの純粋な SQL-92 アクセスを取得し、ビジネスデータをデータウェアハウスに統合したり、Power BI や Tableau などのお気に入りのツールからライブデータに直接簡単にアクセスしたりできます。
多くの場合、CData のライブ接続は、ツールで利用可能なネイティブのインポート機能を上回ります。あるお客様は、レポートに必要なデータセットのサイズが大きいため、Power BI を効果的に使用できませんでした。同社が CData Power BI Connector for Presto を導入したところ、DirectQuery 接続モードを使用してリアルタイムでレポートを生成できるようになりました。
はじめに
コンポーネントの追加
まず、新しい OLE DB ソース、CData Presto ルックアップ、および 2 つの CData Presto デスティネーション(ルックアップで一致した場合と一致しなかった場合をそれぞれ処理)を新しい Data Flow Task に追加します。
OLE DB ソースの設定
以下の手順に従って、SQL Server インスタンスへの接続に必要なプロパティを指定します。
- OLE DB Source を開き、新しい接続を追加します。ここでサーバーとデータベースの情報を入力します。
- Data access mode メニューで「Table or view」を選択し、Presto にエクスポートするテーブルまたはビューを選択します。
- OLE DB Source ウィザードを閉じ、CData Presto Destination に接続します。
Presto 用の新しい Connection Manager を作成
以下の手順に従って、Connection Manager に接続プロパティを保存します。
- 新しい Connection Manager を作成します:Connection Manager ウィンドウで右クリックし、New Connection をクリックします。Add SSIS Connection Manager ダイアログが表示されます。
- Connection Manager type メニューで CData Presto Connection Manager を選択します。
- 接続プロパティを設定します。通常、Presto 接続には以下が必要です:
- User
- Password
- AccessToken
Presto ルックアップの設定
ルックアップコンポーネントの Transform Editor で、SQL Server ソーステーブルから Presto ルックアップテーブルへのマッピングを定義します。
- Presto ルックアップをダブルクリックして、ルックアップコンポーネントエディタを開きます。
- Connection タブで、先ほど作成した Connection Manager を選択します。
- Connection タブで、Connection Manager を指定(または新規作成)し、データがアップサートされるテーブルを指定します。この例では、Account レコードを転送します。

- Columns タブで、入力カラムの主キーからルックアップカラムの主キーへのマッピングを設定します。

Presto デスティネーションの設定
ルックアップコンポーネントを使用すると、データソースのどのエントリが Presto に既に存在し、どのエントリが新規であるかがわかります。一致が見つかった場合と見つからなかった場合を処理する 2 つの Presto コンポーネントを設定します。
ルックアップ一致デスティネーション
ルックアップコンポーネントが一致を返した場合、Presto の既存レコードを更新します。
- Lookup Match Output を Presto デスティネーションコンポーネントにマップします。
- Presto デスティネーションをダブルクリックして、デスティネーションコンポーネントエディタを開きます。
- Connection Manager タブで、先ほど作成した Connection Manager を選択します。
- 更新するテーブルを指定し、Action を「Update」に設定します。

- Column Mappings タブで、入力カラムからデスティネーションカラムへのマッピングを設定します(SQL Server の主キーカラムを Presto の主キーカラムにマップすることを忘れずに)。

ルックアップ不一致デスティネーション
ルックアップコンポーネントが一致を返さなかった場合、Presto に新しいレコードを追加します。
- Lookup No Match Output を Presto デスティネーションコンポーネントにマップします。
- Presto デスティネーションをダブルクリックして、デスティネーションコンポーネントエディタを開きます。
- Connection Manager タブで、先ほど作成した Connection Manager を選択します。
- 新しいレコードを挿入するテーブルを指定し、Action を「Insert」に設定します。

- Column Mappings タブで、入力カラムからデスティネーションカラムへのマッピングを設定します。

プロジェクトの実行
これでプロジェクトを実行できます。 SSIS Task の実行が完了すると、SQL テーブルのデータが選択したテーブルにエクスポートされます。