【ノーコード】複数のLakebase アカウントのデータを簡単レプリケーション

宮本航太
プロダクトスペシャリスト

複数Lakebase アカウント（sandbox/本番など）連携の複雑さをCData Sync でノーコード解決。テーブルprefix・スキーマ分離で環境別の管理も簡単、自動同期を実現する手順を詳解。

CData Sync は、いろいろなシナリオのデータレプリケーション（同期）を行うことができるスタンドアロンのアプリケーションです。例えば、sandbox および本番インスタンスのデータをデータベースに同期することができます。CData Sync のウェブインターフェースは複数のLakebase コネクションを簡単に管理できます。本記事では、複数のLakebase アカウントを一つのデータベースに同期する方法を説明します。

レプリケーションの同期先を設定

CData Sync では、Lakebase のデータを何台のデータベースにでも複製できます。データベースはクラウドおよびオンプレミスの双方に対応しています。レプリケーションの同期先の設定には、［接続］タブから行います。

［同期先］タブを選択します。
同期先のアイコンをクリックします。本記事では、SQLite を使います。
必要な接続プロパティを入力します。Lakebase をSQLite に複製するには、データソースボックスにファイルパスを指定します。
［接続のテスト］をクリックして、正しく接続できているかをテストします。
［変更を保存］をクリックします。

Lakebase 接続の設定

データソース側にLakebase を設定します。［接続］タブをクリックします。

［接続の追加］セクションで［データソース］タブを選択します。
Lakebase アイコンをデータソースとして選択します。プリインストールされたソースにLakebase がない場合には、追加データソースとしてダウンロードします。
接続プロパティに入力をします。

Databricks Lakebase に接続するには、以下のプロパティを設定します。
- DatabricksInstance: Databricks インスタンスまたはサーバーホスト名を指定します。形式は instance-abcdef12-3456-7890-abcd-abcdef123456.database.cloud.databricks.com です。
- Server: Lakebase データベースをホストするサーバーのホスト名または IP アドレスを指定します。
- Port（オプション）: Lakebase データベースをホストするサーバーのポート番号を指定します。デフォルトは 5432 です。
- Database（オプション）: Lakebase サーバーへの認証後に接続するデータベースを指定します。デフォルトでは認証ユーザーのデフォルトデータベースに接続します。
OAuth クライアント認証

OAuth クライアント資格情報を使用して認証するには、サービスプリンシパルで OAuth クライアントを構成します。手順の概要は以下のとおりです。
1. 新しいサービスプリンシパルを作成・構成する
2. サービスプリンシパルに権限を割り当てる
3. サービスプリンシパル用の OAuth シークレットを作成する
詳細については、ヘルプドキュメントの「Setting Up OAuthClient Authentication」セクションをご参照ください。

OAuth PKCE 認証

PKCE（Proof Key for Code Exchange）を使用した OAuth code タイプで認証するには、以下のプロパティを設定します。
- AuthScheme: OAuthPKCE を指定します。
- User: 認証ユーザーのユーザー ID を指定します。
詳細については、ヘルプドキュメントをご参照ください。
［接続のテスト］をクリックして、正しく接続できているかをテストします。
［変更を保存］をクリックします。

それぞれのLakebase インスタンスのレプリケーションクエリの設定

Data Sync はレプリケーションをコントロールするSQL クエリを簡単なGUI 操作で設定できます。レプリケーションジョブ設定には、［ジョブ］タブに進み、［ジョブを追加］ボタンをクリックします。次にデータソースおよび同期先をそれぞれドロップダウンから選択します。レプリケーションジョブのソースおよび同期先を選択。

テーブル全体をレプリケーションする

テーブル全体をレプリケーションするには、［テーブル］セクションで［テーブルを追加］をクリックします。表示されたテーブルリストからレプリケーションするテーブルをチェックします。.

テーブルをカスタマイズしてレプリケーションする

SQL クエリを使って、レプリケーションをカスタマイズできます。REPLICATE 構文はデータベースのテーブルにデータをキャッシュし、保存するハイレベルコマンドです。Lakebase API がサポートするSELECT クエリを定義することができます。レプリケーションのカスタマイズにはテーブルセクションで［カスタムクエリの追加］をクリックして、クエリステートメントを記述します。

Lakebase のデータのテーブルを差分更新でキャッシュするステートメントは次のとおり:

REPLICATE Orders;

使用するレプリケーションクエリを含むファイルを指定することで特定のデータベースを更新することが可能です。レプリケーションステートメントをセミコロンで区切ります。次のオプションは一つのデータベースに複数のLakebase アカウントのデータを同期する例です:

REPLICATE SELECT ステートメントで異なるtable prefix を使用する:
```
REPLICATE PROD_Orders SELECT * FROM Orders;
```
別の方法として、異なるスキーマを使うことも可能です:
```
REPLICATE PROD.Orders SELECT * FROM Orders;
```

レプリケーションのスケジュール起動

［スケジュール］セクションでは、レプリケーションジョブの自動起動スケジュール設定が可能です。反復同期間隔は、15分おきから毎月1回までの間で設定が可能です。

レプリケーションジョブを設定したら、［変更を保存］します。このように複数のLakebase アカウントのデータを複製するジョブを作成することができました。

はじめる準備はできましたか？

詳細はこちら、または無料トライアルにお申し込みください：

CData Sync お問い合わせ

【ノーコード】複数のLakebase アカウントのデータを簡単レプリケーション

レプリケーションの同期先を設定

Lakebase 接続の設定

OAuth クライアント認証

OAuth PKCE 認証

それぞれのLakebase インスタンスのレプリケーションクエリの設定

テーブル全体をレプリケーションする

テーブルをカスタマイズしてレプリケーションする

レプリケーションのスケジュール起動

はじめる準備はできましたか？

この記事の内容

関連記事