複数Azure Blob Storage アカウントをレプリケーション

宮本航太
宮本航太
プロダクトスペシャリスト
複数のAzure Blob Storage アカウントを、1つあるいは多数のデータベースにレプリケーション。

CData Sync for AzureBlobStorage は、データベースにサンドボックスや製品インスタンスをレプリケートするなどの、レプリケーションの多様なシナリオに対する解決策を提供するスタンドアロンアプリケーションです。Sync for Windows およびSync for Java はどちらもコマンドラインインターフェース(CLI)を含んでおり、複数のAzure Blob Storage 接続を簡単に管理できます。この記事では、CLI を使って複数のAzure Blob Storage アカウントをレプリケートする方法について説明します。

Azure Blob Storage 接続の構成

接続およびE メール通知設定をXML 設定ファイルに保存できます。複数のAzure Blob Storage アカウントをレプリケートするには、複数の設定ファイルを使います。以下にAzure Blob Storage をSQLite にレプリケートする設定例を示します。

Windows

<?xml version="1.0" encoding="UTF-8" ?>
<CDataSync>
  <DatabaseType>SQLite</DatabaseType>
  <DatabaseProvider>System.Data.SQLite</DatabaseProvider>
  <ConnectionString>InitiateOAuth=GETANDREFRESH;</ConnectionString>
  <ReplicateAll>False</ReplicateAll>
  <NotificationUserName></NotificationUserName>
  <DatabaseConnectionString>Data Source=C:\my.db</DatabaseConnectionString>
  <TaskSchedulerStartTime>09:51</TaskSchedulerStartTime>
  <TaskSchedulerInterval>Never</TaskSchedulerInterval>
</CDataSync>

Java

<?xml version="1.0" encoding="UTF-8" ?>
<CDataSync>
<DatabaseType>SQLite</DatabaseType>
  <DatabaseProvider>org.sqlite.JDBC</DatabaseProvider>
  <ConnectionString>InitiateOAuth=GETANDREFRESH;</ConnectionString>
  <ReplicateAll>False</ReplicateAll>
  <NotificationUserName></NotificationUserName>
  <DatabaseConnectionString>Data Source=C:\my.db</DatabaseConnectionString>
</CDataSync>

Azure Blob Storage に接続するには、以下の接続プロパティを設定します。

  • Connection Name:任意の接続名を入力します。
  • File Format:使用するファイル形式を選択します。Sync はCSV、PARQUET、AVRO ファイル形式に対応しています。
  • Azure Storage Account:Azure ストレージアカウント名を入力します。
  • URI:ファイルを含むファイルシステムとフォルダのパスを入力します(例:azureblob://MyContainer/MyBlob)。

CData Sync はMicrosoft OneLake への認証方法を複数サポートしています。Entra ID(旧Azure AD)での認証方法については以下をご参照ください。

Entra ID(旧Azure AD)

Entra ID(旧Azure AD)ユーザーアカウントで接続するには、Auth Scheme で「Entra ID」(旧Azure AD)を選択します。CData Sync には組み込みのOAuth アプリケーションが用意されているため、追加のプロパティを設定する必要はありません。

その他の認証方法については、ヘルプドキュメントをご参照ください。

その他の認証方法

  • Azure Service Principal
  • Azure Service Principal Certificate
  • Azure Managed Service Identity
  • Azure Access Key(デフォルト)
  • Azure Storage SAS

各Azure Blob Storage インスタンスにクエリを設定

Sync を使うと標準SQL でレプリケーションを制御できます。REPLICATE ステートメントはハイレベルなコマンドで、データベースにテーブルをキャッシュして維持します。Azure Blob Storage API がサポートするあらゆるSELECT クエリを定義できます。下記のステートメントは、Azure Blob Storage のデータ のテーブルをキャッシュしてインクリメンタルに更新します。

REPLICATE MyFolder;

特定のデータベースを更新するために使用するレプリケーションクエリを含むファイルを指定することができます。レプリケーションステートメントはセミコロンで区切ります。次のオプションは、複数のAzure Blob Storage アカウントを同じデータベースにレプリケートする場合に便利です。

REPLICATE SELECT ステートメントでは、異なるテーブルのプレフィックスを使用できます。

REPLICATE PROD_MyFolder SELECT * FROM MyFolder

異なるスキーマを使用することもできます。

REPLICATE PROD.MyFolder SELECT * FROM MyFolder

Sync の実行

接続文字列およびレプリケーションクエリの設定が完了したら、次のコマンドラインオプションを使ってSync を実行できます。

Windows

AzureBlobStorageSync.exe -g MyProductionAzureBlobStorageConfig.xml -f MyProductionAzureBlobStorageSync.sql

Java

java -Xbootclasspath/p:c:\sqlitejdbc.jar -jar AzureBlobStorageSync.jar -g MyProductionAzureBlobStorageConfig.xml -f MyProductionAzureBlobStorageSync.sql

はじめる準備はできましたか?

詳細はこちら、または無料トライアルにお申し込みください:

CData Sync お問い合わせ