CData Sync
ニアリアルタイムのレプリケーションを実現する変更データキャプチャ(CDC)
ソースログから挿入・更新・削除を直接ストリーミングし、下流システムへリアルタイムに反映。CData Sync のCDC は、管理者権限の昇格や厳格なデータ正規化を必要とせず、低レイテンシーで信頼性の高い変更データキャプチャを予測可能かつスケーラブルな価格で提供します。
CDC でできること
CData Sync はログベースのCDC を使用して、テーブルスキャンなしで挿入・更新・削除を検出します。変更は下流システムへ継続的に配信されるため、分析・オペレーション・AI ワークロードは常に最新のアクティビティを反映した状態を保ちます。
ログベースのキャプチャ
WAL(Write-Ahead Log)、Redo ログ、バイナリログ、またはネイティブの変更追跡機能を読み取り、テーブルに対するクエリを実行することなく行レベルの変更を検出します。
ニアリアルタイムのレプリケーション
現在のログ位置を維持し、変更が発生するとすぐに適用することで、下流データを継続的にリフレッシュします。
ガバナンスに準拠したデリバリー
リトライ、順序保証、オプションの変更履歴を備え、監査・系統追跡・リカバリ要件に対応した変更配信を実現します。
CDC が重要な理由
CDC は、本番データベースに過度な負荷をかけることなくデータを最新に保つ必要があるシステム向けに設計されています。変更されたデータのみを移動することで、繰り返しフルリフレッシュを行う必要がなくなり、データ量や変更頻度が増加しても下流システムの同期を維持できます。
- 頻繁なテーブルスキャンやリロードと比較して、ソースへの影響を軽減
- 分析・オペレーション・AI ワークロードをライブアクティビティと同期
- データベースの成長や変更頻度の増加に合わせて効率的にスケール
- 予測不能なコンピューティングコストなしで継続的なデータ移動をサポート
CDC の主なユースケース
変更データキャプチャは、データの鮮度とスケールが重要な場面で最も価値を発揮します。
- オペレーショナルダッシュボードをライブトランザクションアクティビティと同期
- フルリロードなしでデータウェアハウスやレイクハウスを最新の状態に維持
- AI パイプライン、ベクトルインデックス、RAG システムに最新のコンテキストを提供
- ERP、注文管理、物流プラットフォームなどの高ボリュームシステムをレプリケート
対応データソース
CData Sync は、主要なオペレーショナルデータベースでCDC レプリケーションをサポートしています。
CDC の主な機能
ログベースレプリケーション
データベースのトランザクションログを直接読み取り、ソースへの負荷を最小限に抑えながら効率的に変更をキャプチャします。
増分デリバリー
保持されたログ位置を使用して、新規または変更された行のみを適用し、レイテンシーとコンピューティングコストを削減します。高ボリューム変更に対応
パフォーマンスや信頼性を低下させることなく、大規模なオペレーショナルシステム全体で持続的な変更レートを処理するよう設計されています。自動リジューム
中断後も継続性を維持するため、最後に記録されたログシーケンス番号(LSN)オフセットからジョブ処理を自動的に再開します。変更履歴の追跡
監査レビュー、デバッグ、ロールバックワークフローのために、オプションで変更イベントを保存できます。統合モニタリング
すべてのCDC ジョブのレイテンシー、スループット、処理行数をダッシュボードで一元表示します。CDC は実際のビジネス環境で大規模に稼働
ある大手輸送ネットワーク企業は、数十のオペレーショナルシステムにまたがる変更駆動型レプリケーションを最新化するためにCData Sync を採用しました。この企業は毎月40万件以上のCDC ジョブを実行し、約800億行のレプリケーションデータを処理しています。Sync のCDC を使用することで、出荷・ルーティング・コンプライアンスデータを予測可能かつスケーラブルなコストで常に最新の状態に保っています。
その結果、パイプライン開発時間を50%削減し、財務予測の精度を向上させ、2,000人以上のビジネスユーザーにより信頼性の高いダッシュボードを提供できるようになりました。Sync のCDC は、人員配置、キャパシティ、顧客へのコミットメントに関するタイムリーな意思決定をサポートしています。
CDC ジョブの作成手順
- ソースシステムでCDC を有効化します。
- Sync で新しいジョブを作成し、CDC 対応のソースと同期先を選択します。
- レプリケーションタイプとしてChange Data Capture を選択します。
- パイプラインに含めるスキーマとテーブルのタスクを追加します。
変更データキャプチャについてもっと詳しく
CData Sync でCDC パイプラインを始めましょう
主要テーブルで拡張CDC を実行し、エンドツーエンドのデータ鮮度、レイテンシー、ソースへの影響を測定してみてください。