【ノーコード】Azure Blob Storage のデータを複数のデータベースにレプリケーション。
常時起動のアプリケーションは、自動フェイルオーバー機能およびリアルタイムなデータアクセスを必要とします。CData Sync は、リアルタイムAzure Blob Storage のデータをミラーリングデータベース、上記稼働のクラウドデータベース、レポーティングサーバーなどのほかのデータベースに連携し、Windows からリモートAzure Blob Storage に接続し、自動的に同期を取ります。
レプリケーションの同期先の設定
CData Sync を使って、Azure Blob Storage をクラウド・オンプレにかかわらず複数のデータベースレプリケーションします。レプリケーションの同期先を追加するには、[接続]タブを開きます。
それぞれのデータベース向けに以下を行います:
- [同期先]タブをクリックします。
- 同期先を選択します。この記事では、SQLite を使います。
- 必要な接続プロパティを入力します。SQLite データベースにAzure Blob Storage をレプリケートするためにDataSource ボックスにファイルパスを入力します。
- [接続のテスト]をクリックして、正しく接続できているかをテストします。
- [変更を保存]をクリックします。
Azure Blob Storage 接続の設定
データソース側にAzure Blob Storage を設定します。[接続]タブをクリックします。
- [同期先]タブをクリックします。
- Azure Blob Storage アイコンをデータソースとして選択します。プリインストールされたソースにAzure Blob Storage がない場合には、追加データソースとしてダウンロードします。
- 接続プロパティに入力をします。
Azure Blob Storage に接続するには、以下の接続プロパティを設定します。
- Connection Name:任意の接続名を入力します。
- File Format:使用するファイル形式を選択します。Sync はCSV、PARQUET、AVRO ファイル形式に対応しています。
- Azure Storage Account:Azure ストレージアカウント名を入力します。
- URI:ファイルを含むファイルシステムとフォルダのパスを入力します(例:azureblob://MyContainer/MyBlob)。
CData Sync はMicrosoft OneLake への認証方法を複数サポートしています。Entra ID(旧Azure AD)での認証方法については以下をご参照ください。
Entra ID(旧Azure AD)
Entra ID(旧Azure AD)ユーザーアカウントで接続するには、Auth Scheme で「Entra ID」(旧Azure AD)を選択します。CData Sync には組み込みのOAuth アプリケーションが用意されているため、追加のプロパティを設定する必要はありません。
その他の認証方法については、ヘルプドキュメントをご参照ください。
その他の認証方法
- Azure Service Principal
- Azure Service Principal Certificate
- Azure Managed Service Identity
- Azure Access Key(デフォルト)
- Azure Storage SAS
- [接続のテスト]をクリックして、正しく接続できているかをテストします。
- [変更を保存]をクリックします。
レプリケーションを実行するクエリの設定
CData Sync はレプリケーションをコントロールするSQL クエリを簡単なGUI 操作で設定できます。レプリケーションジョブ設定には、[ジョブ]タブに進み、[ジョブを追加]ボタンをクリックします。 次にデータソースおよび同期先をそれぞれドロップダウンから選択します。
テーブル全体をレプリケーションする
テーブル全体をレプリケーションするには、[テーブル]セクションで[テーブルを追加]をクリックします。表示されたテーブルリストからレプリケーションするテーブルをチェックします。
テーブルをカスタマイズしてレプリケーションする
SQL クエリを使って、レプリケーションをカスタマイズすることができます。REPLICATE ステートメントは、データベースにテーブルをキャッシュして、保持するハイレベルなコマンドです。Azure Blob Storage API でサポートされているSELECT クエリを使うことができます。レプリケーションのカスタマイズには、[カスタムクエリを追加]をクリックして、カスタムクエリステートメントを定義します。
次のステートメントは、Azure Blob Storage のテーブルのアップデートを差分更新でキャッシュします:
REPLICATE MyFolder;
特定のデータベースを更新するために、レプリケーションクエリを含むファイルを指定することもできます。レプリケーションクエリをセミコロンで区切ります。複数のAzure Blob Storage アカウントを同じデータベースに同期しようとする際には、以下のオプションが便利です:
-
REPLICATE SELECT ステートメントで別のprefix を使う:
REPLICATE PROD_MyFolder SELECT * FROM MyFolder;
-
別の方法では、別のスキーマを使う:
REPLICATE PROD.MyFolder SELECT * FROM MyFolder;
レプリケーションのスケジュール起動設定
[スケジュール]セクションでは、レプリケーションジョブの自動起動スケジュール設定が可能です。反復同期間隔は、15分おきから毎月1回までの間で設定が可能です。
レプリケーションジョブを設定したら、[変更を保存]ボタンを押して保存します。Azure Blob Storage のオンプレミス、クラウドなどのデータベースへのレプリケーションジョブは一つではなく複数を作成することが可能です。