CData Sync を使って Amazon S3 バケット内の複数ファイルからデータをレプリケーションする方法



Amazon S3 は、Web 規模のコンピューティングを実現するために設計されたインターネットストレージサービスです。 S3 を使えば、いつでもどこからでも、あらゆる量のデータを保存・取得できます。 開発者は、Amazon が使用しているのと同じインフラストラクチャを活用して、スケーラブルで信頼性が高く、高速かつコスト効率の良いストレージにアクセスできます。

CData Sync は、ディレクトリやフォルダーを指定して、同じ形式のファイルをすべて取得し、 1 つの同期先テーブルにレプリケーションできます。初回のレプリケーション後は、 CData Sync がディレクトリ内の各ファイルの最終更新日をチェックし、新しいファイルのみを取り込むため、 重複データのレプリケーションを防止します。

組織では、定期的なデータ(領収書、請求書など)に関連するファイルを定期的に生成することがよくあります。 この記事では、CSV ファイルを含む S3 バケットがあることを前提に、これらのファイルから関連データを Snowflake データウェアハウスにレプリケーションする方法を解説します。

それでは、CData Sync インスタンスにログインして、CData Sync から CSV ファイルをソースコネクタとして設定していきましょう。

複数ファイルからデータを読み取る CSV ソースの設定

CSV ファイルからデータをレプリケーションするには、まず CData Sync で CSV ソース接続を設定します。

  1. CData Sync にログインし、[Connections]タブに移動します。[+ Add Connection]をクリックし、[Sources]を選択して、 CSV を検索して選択します。
  2. Connection Type、AWS Region、Auth Scheme、AWS Access Key、AWS Secret Key、URI などの接続プロパティを入力します。 URI は、S3 バケットフォルダー内で「Copy S3 URI」をクリックして取得できます。
  3. 複数ファイルにわたってデータをレプリケーションするには、Aggregate Files を True に設定します。[Save and Test]をクリックします。

Snowflake を同期先として設定

CSV 接続をテストして保存したら、次に同期先(この場合は Snowflake)に接続します。

  1. [Connections]タブをクリックし、[Destinations]を選択して、Snowflake を選びます。
  2. Warehouse、URL、Auth Scheme、User、Password、Database、Schema などの Snowflake 接続プロパティを入力し、 [Save and Test]をクリックします。

複数ファイルから Snowflake へのデータレプリケーション

これで、S3 バケット内の複数ファイルから Snowflake データウェアハウスにレプリケーションするジョブを作成する準備が整いました。

  1. Sync インターフェースで[Jobs]をクリックし、[+ Add Job]を選択します。
  2. ジョブに名前を付け、先ほど作成した CSV ソースと Snowflake 同期先の接続を選択します。 [Add Job]をクリックします。
  3. ジョブが作成されたら、ジョブを選択して[Task]タブをクリックします。[+ Add Tasks]をクリックし、 AggregatedFiles テーブルを選択します。[Add Tasks (1)]をクリックします。
  4. 既存のテーブルにデータをレプリケーションするか、新しいテーブルを作成できます(同期先テーブルを変更するには、 タスクの[Overview]タブで Destination Information の編集ボタンをクリックします)。
  5. タスクの[Column]タブに移動し、カラムマッピングが正しいことを確認します。
  6. [Job]画面で[Run]をクリックします。
  7. 次に、Snowflake インスタンスを確認して、CSV ファイルのデータが正しくレプリケーションされたことを確認します。

無料トライアル & 詳細情報

Amazon S3 に保存された複数ファイルからデータをレプリケーションする方法をご覧いただきました。 CData Sync のページで詳細情報をご確認いただき、 無料トライアルをダウンロードしてください。今すぐエンタープライズデータの統合を始めましょう!ご質問がございましたら、 サポートチームがいつでもお手伝いいたします。

始める準備はできましたか?

CData Sync の無料トライアルをダウンロード:

今すぐダウンロード