Hive:
Apache Hive は、Hadoop の分散ファイルシステムに保存された大規模なデータセットを照会および分析するための、Hadoop 上に構築されたオープンソースのデータウェアハウス(DWH)インフラストラクチャです。ユーザーがクエリを記述するための SQL ライクなインターフェースを提供し、構造化データと半構造化データの要約、アドホッククエリ、分析をサポートします。
Apache Cassandra:
Apache Cassandra は、複数のサーバーにわたって大量のデータを処理するように設計された、高度にスケーラブルな分散型 NoSQL データベース管理システムです。高可用性と耐障害性を提供し、高速な読み取りと書き込み操作を必要とするミッションクリティカルなアプリケーションに理想的です。Cassandra はシームレスなスケーラビリティとパフォーマンスのために分散アーキテクチャを使用しています。
CData Sync で Hive と Apache Cassandra を統合
CData Sync は、Apache Hive データを任意のデータベース、データレイク、データウェアハウスに継続的にパイプライン化する簡単な方法を提供し、分析、レポート作成、AI、機械学習に容易に利用できるようにします。
- Apache Cassandra を含む、幅広い従来型および新興データベースとデータを同期できます。
- Hive データをデータベースやデータウェアハウスシステムにレプリケートして、運用レポート、BI、分析を促進します。
- Hive からクエリをオフロードして、負荷を軽減しパフォーマンスを向上させます。
- Hive をビジネス分析に接続して、BI と意思決定支援に活用します。
- ディザスタリカバリのために Apache Hive データをアーカイブします。
Hive を Apache Cassandra と統合
Hive データ統合機能
シンプルなノーコード Hive データ統合
コードや複雑なセットアップを不要にして、より短時間でより多くのデータを移動できます。ドラッグアンドドロップの簡単な操作で Hive を任意の宛先に接続できます。
数分で構築できる手間のかからないデータパイプライン
増分更新と自動スキーマレプリケーションにより、Hive データ統合の悩みを解消し、Apache Cassandra が常に最新のデータを保持できるようにします。
行ごとの課金はありません
予測可能で透明性の高い価格設定で、重要なすべてのデータをレプリケートできます。Hive と Apache Cassandra 間の無制限のレプリケーション。
その他の Hive データ統合ツール
Hive からサポートされている任意のデータストアにデータを統合・レプリケートするデータパイプラインを簡単に作成できます: