Amazon S3 データを SingleStore に自動で継続的にレプリケーションする方法

Stanley Liu
Stanley Liu
Associate Technical Product Marketer
CData Sync を使って、Amazon S3 データを SingleStore に自動・継続的・カスタマイズ可能なレプリケーションを実現する方法を解説します。

常時稼働のアプリケーションには、自動フェイルオーバー機能とリアルタイムのデータアクセスが欠かせません。CData Sync を使えば、SingleStore インスタンスにAmazon S3 のデータをリアルタイムで統合できます。すべてのデータを1カ所に集約し、アーカイブ、レポーティング、分析、機械学習、AI などさまざまな用途に活用できます。

SingleStore を同期先として設定する

CData Sync を使って、Amazon S3 のデータ を SingleStore にレプリケーションできます。同期先を追加するには、接続タブに移動します。

  1. 接続の追加をクリックします。
  2. 同期先タブを選択し、SingleStore コネクタを探します。
  3. 該当行の末尾にある接続の設定アイコンをクリックして、新しい接続ページを開きます。接続の設定アイコンが表示されていない場合は、コネクタのダウンロードアイコンをクリックして SingleStore コネクタをインストールします。新しいコネクタのインストールについて詳しくは、ヘルプドキュメントの「接続」セクションをご覧ください。
  4. SingleStore に接続するには、必要な接続プロパティを入力し、認証スキームを選択します(以下を参照):

    • Server:SingleStore データベースをホストしているサーバーのホスト名または IP アドレスを入力します。
    • Port:SingleStore データベースをホストしているサーバーのポート番号を入力します。
    • Database(オプション):SingleStore サーバーに接続する際のデフォルトデータベースを入力します。設定しない場合は、すべてのデータベースのテーブルが利用可能になります。

    標準認証で接続する

    標準認証を使用する場合は、以下を設定します:

    • User:SingleStore サーバーで認証するためのユーザー名を入力します。
    • Password:SingleStore サーバーで認証するためのパスワードを入力します。

    統合セキュリティで接続する

    標準のユーザー名とパスワードの代わりに、IntegratedSecurityTrue に設定して、Windows 認証を介して信頼できるユーザーをサーバーに認証させることができます。

    SSL 認証で接続する

    SSL 認証を使用して、安全なセッションで SingleStore データに接続できます。以下の接続プロパティを設定してデータに接続します:

    • SSLClientCert:クライアント証明書の証明書ストア名を設定します。双方向 SSL(トラストストアとキーストアがクライアントとサーバーの両方に保持される場合)で使用されます。
    • SSLClientCertPassword:クライアント証明書ストアがパスワードで保護されている場合は、ストアのパスワードを設定します。
    • SSLClientCertSubject:TLS/SSL クライアント証明書のサブジェクトを入力します。ストア内の証明書を特定するために使用されます。
    • SSLClientCertType:クライアントストアの証明書タイプを入力します。
    • SSLServerCert:サーバーから受け入れる証明書を入力します。

    SSH 認証で接続する

    SSH を使用すると、リモートマシンに安全にログインできます。SSH 経由で SingleStore データにアクセスするには、以下の接続プロパティを設定します:

    • SSHClientCert:クライアント証明書の証明書ストア名を設定します。
    • SSHClientCertPassword:クライアント証明書ストアがパスワードで保護されている場合は、ストアのパスワードを設定します。
    • SSHClientCertSubject:TLS/SSL クライアント証明書のサブジェクト。ストア内の証明書を特定するために使用されます。
    • SSHClientCertType:クライアントストアの証明書タイプ。
    • SSHPassword:SSH サーバーで認証するためのパスワード。
    • SSHPort:SSH 操作に使用するポート。
    • SSHServer:認証先の SSH 認証サーバー。
    • SSHServerFingerPrint:接続先ホストの検証に使用される SSH サーバーのフィンガープリント。
    • SSHUser:SSH サーバーで認証するためのユーザー名を設定します。
  5. 接続が確立されたら、作成およびテストをクリックして接続を作成、テスト、保存します。

これで SingleStore に接続され、データソースとしても同期先としても使用できるようになりました。

NOTEラベル機能を使って、データソースや同期先にラベルを追加できます。

この記事では、Amazon S3 のデータ を SingleStore にロードし、同期先として活用する方法をご紹介します。

Amazon S3 への接続を設定する

Amazon S3 への接続は、接続タブから設定できます。Amazon S3 アカウントへの接続を追加するには、接続タブに移動します。

  1. 接続の追加をクリックします。
  2. データソース(Amazon S3)を選択します。
  3. 接続プロパティを設定します。

    Amazon S3 リクエストを認可するには、管理者アカウントまたはカスタム権限を持つIAM ユーザーの認証情報を入力します。AccessKey をアクセスキーID に設定します。SecretKey をシークレットアクセスキーに設定します。

    Note: AWS アカウント管理者として接続できますが、AWS サービスにアクセスするにはIAM ユーザー認証情報を使用することをお勧めします。

    尚、CData 製品はAmazon S3 のファイルの一覧表示やユーザー管理情報の取得用です。S3 に保管されているExcel、CSV、JSON などのファイル内のデータを読み込みたい場合には、Excel DriverCSV DriverJSON Driver をご利用ください。

    アクセスキーの取得

    IAM ユーザーの資格情報を取得するには:

    1. IAM コンソールにサインインします。
    2. ナビゲーションペインで「ユーザー」を選択します。
    3. ユーザーのアクセスキーを作成または管理するには、ユーザーを選択してから「セキュリティ認証情報」タブを選択します。

    AWS ルートアカウントの資格情報を取得するには:

    1. ルートアカウントの資格情報を使用してAWS 管理コンソールにサインインします。
    2. アカウント名または番号を選択し、表示されたメニューで「My Security Credentials」を選択します。
    3. 「Continue to Security Credentials」をクリックし、「Access Keys」セクションを展開して、ルートアカウントのアクセスキーを管理または作成します。

    AWS ロールとして認証

    多くの場合、認証にはAWS ルートユーザーのダイレクトなセキュリティ認証情報ではなく、IAM ロールを使用することをお勧めします。RoleARN を指定することでAWS ロールを代わりに使用できます。これにより、CData 製品は指定されたロールの資格情報を取得しようと試みます。

    (すでにEC2 インスタンスなどで接続されているのではなく)AWS に接続している場合は、ロールを引き受けるIAM ユーザーのAccessKey とSecretKey を追加で指定する必要があります。AWS ルートユーザーのAccessKey および SecretKey を指定する場合、ロールは使用できません。

    SSO 認証

    SSO 認証を必要とするユーザーおよびロールには、RoleARN およびPrincipalArn 接続プロパティを指定してください。各Identity Provider に固有のSSOProperties を指定し、AccessKey とSecretKey を空のままにする必要があります。これにより、CData 製品は一時的な認証資格情報を取得するために、リクエストでSSO 認証情報を送信します。

  4. Amazon S3 に接続をクリックして、接続が正しく設定されていることを確認します。
  5. 作成およびテストをクリックして変更を保存します。

レプリケーションクエリの設定

CData Sync では、ポイント&クリック操作と SQL クエリの両方でレプリケーションを制御できます。レプリケーションを設定するには、ジョブタブに移動し、ジョブを追加をクリックします。レプリケーションのデータソースと同期先を選択します。

テーブル全体をレプリケーションする

テーブル全体をレプリケーションするには、ジョブのタスクタブでタスクを追加をクリックし、SingleStore にレプリケーションしたい Amazon S3 テーブルをリストから選択して、再度タスクを追加をクリックします。

レプリケーションのカスタマイズ

タスクのカラムタブとクエリタブを使って、レプリケーションをカスタマイズできます。カラムタブでは、レプリケーションするカラムの指定、同期先でのカラム名の変更、レプリケーション前のデータ操作などが可能です。クエリタブでは、SQL クエリを使ってフィルタ、グループ化、ソートを追加できます。

レプリケーションのスケジュール

ジョブの概要タブを選択し、スケジュールの下にある設定をクリックします。10分ごとから月1回まで、指定した間隔でジョブを自動実行するようにスケジュールできます。

レプリケーションジョブを設定したら、変更を保存をクリックします。Amazon S3 のデータ から SingleStore へのレプリケーションを管理するジョブをいくつでも設定できます。

レプリケーションジョブの実行

ジョブに必要なすべての設定が完了したら、レプリケーションしたい Amazon S3 テーブルを選択し、実行をクリックします。レプリケーションが正常に完了すると、ジョブの実行時間とレプリケーションされた行数を示す通知が表示されます。

無料トライアル & 詳細情報

Amazon S3 のデータ を SingleStore にレプリケーションする方法をご覧いただきました。CData Sync ページで詳細をご確認いただき、30日間の無料トライアルをダウンロードして、エンタープライズデータの統合を始めましょう。

ご不明な点がございましたら、サポートチームがいつでもお手伝いいたします。

はじめる準備はできましたか?

詳細はこちら、または無料トライアルにお申し込みください:

CData Sync お問い合わせ