複数Scrapfly アカウントをレプリケーション
CData Sync for API は、データベースにサンドボックスや製品インスタンスをレプリケートするなどの、レプリケーションの多様なシナリオに対する解決策を提供するスタンドアロンアプリケーションです。Sync for Windows およびSync for Java はどちらもコマンドラインインターフェース(CLI)を含んでおり、複数のScrapfly 接続を簡単に管理できます。この記事では、CLI を使って複数のScrapfly アカウントをレプリケートする方法について説明します。
Scrapfly 接続の構成
接続およびE メール通知設定をXML 設定ファイルに保存できます。複数のScrapfly アカウントをレプリケートするには、複数の設定ファイルを使います。以下にScrapfly をSQLite にレプリケートする設定例を示します。
Windows
<?xml version="1.0" encoding="UTF-8" ?> <CDataSync> <DatabaseType>SQLite</DatabaseType> <DatabaseProvider>System.Data.SQLite</DatabaseProvider> <ConnectionString>Profile=C:\profiles\Scrapfly.apip;AuthScheme=APIKey;ProfileSettings='APIKey=your_api_key';</ConnectionString> <ReplicateAll>False</ReplicateAll> <NotificationUserName></NotificationUserName> <DatabaseConnectionString>Data Source=C:\my.db</DatabaseConnectionString> <TaskSchedulerStartTime>09:51</TaskSchedulerStartTime> <TaskSchedulerInterval>Never</TaskSchedulerInterval> </CDataSync>
Java
<?xml version="1.0" encoding="UTF-8" ?> <CDataSync> <DatabaseType>SQLite</DatabaseType> <DatabaseProvider>org.sqlite.JDBC</DatabaseProvider> <ConnectionString>Profile=C:\profiles\Scrapfly.apip;AuthScheme=APIKey;ProfileSettings='APIKey=your_api_key';</ConnectionString> <ReplicateAll>False</ReplicateAll> <NotificationUserName></NotificationUserName> <DatabaseConnectionString>Data Source=C:\my.db</DatabaseConnectionString> </CDataSync>
Scrapfly API は API キー認証を使用します。API キーは、すべてのリクエストで key クエリパラメータとして渡されます。
API キー認証の設定
接続を作成するには、Scrapfly の API キーが必要です。API キーを取得するには、以下のステップで進めます:
- scrapfly.io で Scrapfly アカウントにログインします。
- Dashboard に移動して API Keys を選択します。
- API キーをコピーします(本番環境用は scp-live-、テスト環境用は scp-test- で始まります)。
API キーを取得したら、以下の接続プロパティを設定します:
- AuthScheme:APIKey に設定します。
- APIKey:Scrapfly の API キーに設定します。
接続文字列の例:
Profile=C:\profiles\Scrapfly.apip;AuthScheme=APIKey;ProfileSettings='APIKey=your_api_key';
各Scrapfly インスタンスにクエリを設定
Sync を使うと標準SQL でレプリケーションを制御できます。REPLICATE ステートメントはハイレベルなコマンドで、データベースにテーブルをキャッシュして維持します。Scrapfly API がサポートするあらゆるSELECT クエリを定義できます。下記のステートメントは、Scrapfly のデータ のテーブルをキャッシュしてインクリメンタルに更新します。
REPLICATE Account;
特定のデータベースを更新するために使用するレプリケーションクエリを含むファイルを指定することができます。レプリケーションステートメントはセミコロンで区切ります。次のオプションは、複数のScrapfly アカウントを同じデータベースにレプリケートする場合に便利です。
REPLICATE SELECT ステートメントでは、異なるテーブルのプレフィックスを使用できます。
REPLICATE PROD_Account SELECT * FROM Account
異なるスキーマを使用することもできます。
REPLICATE PROD.Account SELECT * FROM Account
Sync の実行
接続文字列およびレプリケーションクエリの設定が完了したら、次のコマンドラインオプションを使ってSync を実行できます。
Windows
APISync.exe -g MyProductionAPIConfig.xml -f MyProductionAPISync.sql
Java
java -Xbootclasspath/p:c:\sqlitejdbc.jar -jar APISync.jar -g MyProductionAPIConfig.xml -f MyProductionAPISync.sql