Apache Hive データコネクタ

CData Virtuality で Hive へのアクセスを一元化し、アナリティクス、レポート、データ管理、アプリケーション統合を実現します。


製品ツアーを開始 お問い合わせ
Diagram
Hive Logo



Apache Hive について

Apache Hive は、Hadoop の分散ファイルシステムに保存された大規模なデータセットを照会および分析するための、Hadoop 上に構築されたオープンソースのデータウェアハウス(DWH)インフラストラクチャです。ユーザーがクエリを記述するための SQL ライクなインターフェースを提供し、構造化データと半構造化データの要約、アドホッククエリ、分析をサポートします。

バイモーダル Hive データ統合

レプリケーションデータとライブデータの両方を接続できる唯一のバイモーダル統合スタックで、エンタープライズアプリケーションやハイブリッドインフラストラクチャ全体でリアルタイムのデータアクセスを提供します。CData Virtuality を使用すると、組織全体のあらゆるアプリケーションやプロセスと Hive データを簡単に統合できます。

アナリティクス & レポート

組織のアナリティクスやレポートプロセスと Hive データを迅速に統合します。リアルタイムでデータにアクセスするか、データ移動機能を活用して Hive データをエンタープライズデータパイプラインに統合します。

  • データのオンデマンド: BI ツールが最新の Hive データを使用できるようにします。仮想レイヤーを通じて他のデータソースと一緒に Hive データをクエリできます。
  • BI との統合: Tableau、Power BI、Qlik などのツールとシームレスに接続し、レポートやダッシュボードを作成できます。
  • パフォーマンスの向上: インテリジェントなインメモリキャッシュ、ソースシステムへのプッシュダウン、繰り返しクエリ用のサードパーティデータベースへの物理データ移動(マテリアライゼーション)により、大規模なデータ処理を高速化します。
Analytics & reporting
Analytics & reporting

データ統合(ETL/ELT/リバースETL)

CData Virtuality は、データ仮想化と自動化された ETL プロセスを組み合わせた強力な統合ツールです。Hive を含むさまざまなデータソースを抽出、統合、処理することで、アジャイルなデータインフラストラクチャを構築できます。

  • レプリケーションの自動化: データベースまたはクラウドデータウェアハウスに Hive データのコピーを作成し、自動的に最新の状態に保ちます。
  • データ変更の管理: Hive スキーマをデータストレージと同期し、レプリケートされたオブジェクトに新しいフィールドが追加された場合も更新します。

自動化 & ワークフロー

統合されたコネクティビティプラットフォームを通じて、異なるシステム間でシームレスな Hive データフロー、自動化、オーケストレーションを実現します。

  • RPA ツールとの統合: UiPath、Blue Prism、Automation Anywhere などの RPA(ロボティック・プロセス・オートメーション)ツールと統合し、ワークフローアプリケーションに関わる反復的なタスクやデータフローを自動化します。
  • BPM ツールとの統合: Camunda、Bizagi、Pega などの BPM(ビジネスプロセス管理)ツールと接続し、複雑なワークフローをオーケストレーションおよび管理します。
Automation workflow
Data governance

データガバナンス & 管理

CData Virtuality を使用すると、一元化されたコントロールと監査機能を確立し、高いデータ品質、セキュリティ、コンプライアンスを確保できます。

  • アクセス管理: 堅牢な権限システムにより、ユーザーロールごとに表示範囲とアクションをカスタマイズできます。
  • データリネージ: データの移動と変換を自動的に追跡し、データの起源、変更、使用状況を明確にします。
  • データの保護: カラムマスキングで機密データを保護し、プライバシーとコンプライアンスのために行レベルおよび列レベルでアクセスを細かく調整できます。
  • メタデータの追跡: メタデータの変更履歴を詳細に記録し、効果的な追跡と復元を可能にし、データの整合性を確保します。

Hive & データ仮想化

CData の Virtuality Platform™ は、エンタープライズデータコネクティビティに革命をもたらし、あらゆるデータソースとのシームレスな統合を実現します。数百ものエンタープライズクラスのデータコネクタを備え、継続的に追加されています。CData により、データがどこにあっても即座にアクセスできます。これにより、アナリストやデータサイエンティストはすべてのデータソースに高速かつ高性能でアクセスでき、より迅速で洞察に富んだ意思決定を促進し、組織のアジリティを新たな高みへと引き上げます。

さあ、始めましょう

今すぐ CData Virtuality を始めましょう