複数Microsoft OneLake アカウントをレプリケーション
CData Sync for OneLake は、データベースにサンドボックスや製品インスタンスをレプリケートするなどの、レプリケーションの多様なシナリオに対する解決策を提供するスタンドアロンアプリケーションです。Sync for Windows およびSync for Java はどちらもコマンドラインインターフェース(CLI)を含んでおり、複数のMicrosoft OneLake 接続を簡単に管理できます。この記事では、CLI を使って複数のMicrosoft OneLake アカウントをレプリケートする方法について説明します。
Microsoft OneLake 接続の構成
接続およびE メール通知設定をXML 設定ファイルに保存できます。複数のMicrosoft OneLake アカウントをレプリケートするには、複数の設定ファイルを使います。以下にMicrosoft OneLake をSQLite にレプリケートする設定例を示します。
Windows
<?xml version="1.0" encoding="UTF-8" ?> <CDataSync> <DatabaseType>SQLite</DatabaseType> <DatabaseProvider>System.Data.SQLite</DatabaseProvider> <ConnectionString>InitiateOAuth=GETANDREFRESH;</ConnectionString> <ReplicateAll>False</ReplicateAll> <NotificationUserName></NotificationUserName> <DatabaseConnectionString>Data Source=C:\my.db</DatabaseConnectionString> <TaskSchedulerStartTime>09:51</TaskSchedulerStartTime> <TaskSchedulerInterval>Never</TaskSchedulerInterval> </CDataSync>
Java
<?xml version="1.0" encoding="UTF-8" ?> <CDataSync> <DatabaseType>SQLite</DatabaseType> <DatabaseProvider>org.sqlite.JDBC</DatabaseProvider> <ConnectionString>InitiateOAuth=GETANDREFRESH;</ConnectionString> <ReplicateAll>False</ReplicateAll> <NotificationUserName></NotificationUserName> <DatabaseConnectionString>Data Source=C:\my.db</DatabaseConnectionString> </CDataSync>
Microsoft OneLake に接続するには、以下の接続プロパティを設定します。
- Connection Name:任意の接続名を入力します。
- File Format:使用するファイル形式を選択します。Sync はCSV、PARQUET、AVRO ファイル形式に対応しています。
- Azure Storage Account:Azure ストレージアカウント名を入力します。
- URI:ファイルを含むファイルシステムとフォルダのパスを入力します(例:onelake://Workspace/Test.LakeHouse/Files/CustomFolder)。
CData Sync はMicrosoft OneLake への認証方法を複数サポートしています。Entra ID(旧Azure AD)での認証方法については以下をご参照ください。
Entra ID(旧Azure AD)
Entra ID(旧Azure AD)ユーザーアカウントで接続するには、Auth Scheme で「Entra ID」(旧Azure AD)を選択します。CData Sync には組み込みのOAuth アプリケーションが用意されているため、追加のプロパティを設定する必要はありません。
その他の認証方法については、ヘルプドキュメントをご参照ください。
その他の認証方法
- Azure Service Principal
- Azure Service Principal Certificate
- Azure Managed Service Identity
各Microsoft OneLake インスタンスにクエリを設定
Sync を使うと標準SQL でレプリケーションを制御できます。REPLICATE ステートメントはハイレベルなコマンドで、データベースにテーブルをキャッシュして維持します。Microsoft OneLake API がサポートするあらゆるSELECT クエリを定義できます。下記のステートメントは、Microsoft OneLake のデータ のテーブルをキャッシュしてインクリメンタルに更新します。
REPLICATE MyFolder;
特定のデータベースを更新するために使用するレプリケーションクエリを含むファイルを指定することができます。レプリケーションステートメントはセミコロンで区切ります。次のオプションは、複数のMicrosoft OneLake アカウントを同じデータベースにレプリケートする場合に便利です。
REPLICATE SELECT ステートメントでは、異なるテーブルのプレフィックスを使用できます。
REPLICATE PROD_MyFolder SELECT * FROM MyFolder
異なるスキーマを使用することもできます。
REPLICATE PROD.MyFolder SELECT * FROM MyFolder
Sync の実行
接続文字列およびレプリケーションクエリの設定が完了したら、次のコマンドラインオプションを使ってSync を実行できます。
Windows
OneLakeSync.exe -g MyProductionOneLakeConfig.xml -f MyProductionOneLakeSync.sql
Java
java -Xbootclasspath/p:c:\sqlitejdbc.jar -jar OneLakeSync.jar -g MyProductionOneLakeConfig.xml -f MyProductionOneLakeSync.sql