CData Sync CLI で HDFS のデータ を複数のデータベースにレプリケーションする方法

Jerod Johnson
Jerod Johnson
Senior Technology Evangelist
1つの設定ファイルでHDFS のデータを複数の異なるデータベースにレプリケーションする方法をご紹介します。

常時稼働のアプリケーションには、自動フェイルオーバー機能とリアルタイムのデータアクセスが欠かせません。CData Sync for HDFS を使えば、ミラーリングデータベース、常時稼働のクラウドデータベース、レポーティングサーバーなど、さまざまなデータベースにHDFS のデータをリアルタイム連携できます。Windows やJava が動作するあらゆるマシンから、リモートのHDFS のデータとの自動同期が可能です。

Sync のコマンドラインインターフェース(CLI)を使えば、レプリケーションのほぼすべての設定を簡単に制御できます。設定を変更することなく、HDFS のデータ を1つまたは複数のデータベースにレプリケーションすることが可能です。

HDFS のデータ に接続する

接続文字列やメール通知などの設定は、XML 設定ファイルに保存できます。

以下は、SQLite へレプリケーションする場合の設定例です。

Windows

<?xml version="1.0" encoding="UTF-8" ?>
<CDataSync><DatabaseType>SQLite</DatabaseType>
  <DatabaseProvider>System.Data.SQLite</DatabaseProvider>
  <ConnectionString>Host=sandbox-hdp.hortonworks.com;Port=50070;Path=/user/root;User=root;</ConnectionString>
  <ReplicateAll>False</ReplicateAll>
  <NotificationUserName></NotificationUserName>
  <DatabaseConnectionString>Data Source=C:\my.db</DatabaseConnectionString>
  <TaskSchedulerStartTime>09:51</TaskSchedulerStartTime>
  <TaskSchedulerInterval>Never</TaskSchedulerInterval>
</CDataSync>

Java

<?xml version="1.0" encoding="UTF-8" ?>
<CDataSync><DatabaseType>SQLite</DatabaseType><DatabaseProvider>org.sqlite.JDBC</DatabaseProvider>
<ConnectionString>Host=sandbox-hdp.hortonworks.com;Port=50070;Path=/user/root;User=root;</ConnectionString>
<ReplicateAll>False</ReplicateAll>
<NotificationUserName></NotificationUserName>
<DatabaseConnectionString>Data Source=C:\my.db</DatabaseConnectionString>
</CDataSync>

HDFS 接続プロパティの取得・設定方法

HDFS への認証には、次の接続プロパティを設定します。

  • Host:HDFS インスタンスのホストに設定。
  • Port:HDFS インスタンスのポートに設定。デフォルトのポートは"9870" です。

レプリケーションクエリの設定

Sync では、標準 SQL を使ってレプリケーションを制御できます。REPLICATE 文は、データベース内のテーブルをキャッシュして維持するための高レベルコマンドです。 HDFS API がサポートする任意の SELECT クエリを定義できます。 以下の文は、HDFS のデータ のテーブルをキャッシュし、差分更新を行います:

REPLICATE Files;

レプリケーションクエリを含むファイルを指定することもできます。これにより、同じレプリケーションクエリを使って複数のデータベースへレプリケーションできます。

Sync を実行する

接続文字列とレプリケーションクエリを設定したら、以下のコマンドラインオプションで Sync を実行できます:

Windows

HDFSSync.exe -g MySQLiteConfig.xml -f HDFSSync.sql

Java

java -Xbootclasspath/p:c:\sqlitejdbc.jar -jar HDFSSync.jar -g MySQLiteConfig.xml -f HDFSSync.sql

はじめる準備はできましたか?

詳細はこちら、または無料トライアルにお申し込みください:

CData Sync お問い合わせ