Tableau Prep で Hive のデータ にリアルタイム接続してビジュアライズする方法

Dibyendu Datta
Dibyendu Datta
Lead Technology Evangelist
CData Tableau Connector と Tableau Prep Builder を使って、Hive のデータ をリアルタイムでビジュアライズする方法を解説します。

Tableau は、企業がデータを活用して課題を解決する方法を変革するビジュアル分析プラットフォームです。CData Tableau Connector for Apache Hive と組み合わせることで、Tableau Prep からHive のデータに簡単にアクセスできるようになります。この記事では、Tableau Prep で Hive に接続し、シンプルなチャートを作成する方法をご紹介します。

CData Tableau Connector を使用すると、Tableau からHive のデータに高速でアクセスできます。コネクタをインストールしたら、Hive で認証するだけで、レスポンシブで動的なビジュアライゼーションとダッシュボードの構築をすぐに開始できます。CData Tableau Connector は、ネイティブの Tableau データ型でHive のデータを提供し、複雑なフィルタ、集計などの操作を自動的に処理することで、Hive のデータ へのシームレスなアクセスを実現します。

NOTE:CData Tableau Connector は、Tableau Prep Builder 2020.4.1 以降をサポートしています。それ以前のバージョンの Tableau Prep Builder をご使用の場合は、CData JDBC Driver をご利用ください。 Tableau Cloud でHive のデータに接続したい場合は、CData Connect AI をご利用ください。

CData Tableau Connector のインストール

CData Tableau Connector for Hive をインストールすると、インストーラが TACO ファイルと JAR ファイルを適切なディレクトリにコピーします。以下の接続手順でデータソースが表示されない場合は、2つのファイルをコピーする必要があります:

  1. コネクタのインストール先(Windows では C:\Program Files\CData\CData Tableau Connector for Hive 20XX\lib)にある lib フォルダ内の TACO ファイル(cdata.apachehive.taco)を、Tableau Prep Builder リポジトリにコピーします:

    • Windows:C:\Users\[Windows ユーザー]\Documents\My Tableau Prep Repository\Connectors
    • MacOS:/Users//Documents/My Tableau Prep Repository/Connectors
  2. 同じ lib フォルダ内の JAR ファイル(cdata.tableau.apachehive.jar)を、Tableau のドライバーディレクトリ(通常 [Tableau のインストール先]\Drivers)にコピーします。

Tableau Prep Builder で Hive に接続する

Tableau Prep Builder を開き、「データに接続」をクリックして「Hive by CData」を検索します。接続を設定し、「サインイン」をクリックします。

Apache Hive への接続を確立するには以下を指定します。

  • Server:HiveServer2 をホストするサーバーのホスト名またはIP アドレスに設定。
  • Port:HiveServer2 インスタンスへの接続用のポートに設定。
  • TransportMode:Hive サーバーとの通信に使用するトランスポートモード。有効な入力値は、BINARY およびHTTP です。デフォルトではBINARY が選択されます。
  • AuthScheme:使用される認証スキーム。有効な入力値はPLAIN、LDAP、NOSASL、およびKERBEROS です。デフォルトではPLAIN が選択されます。
  • CData 製品においてTLS/SSL を有効化するには、UseSSL をTrue に設定します

データの探索と準備

操作したいテーブルとビューをキャンバスにドラッグします。複数のテーブルを含めることができます。

データのクレンジングとフィルタリング

データをさらに準備するために、フィルタの適用、重複の削除、カラムの変更などを行うことができます。

  1. まず、テーブルの横にあるプラス をクリックし、「クリーンステップ」オプションを選択します。
  2. フィルタするフィールド値を選択します。値を選択すると、その選択が他のフィールドにどのように影響するかを確認できます。
  3. 選択した値を持つエントリを「保持のみ」または「除外」を選ぶと、それに応じてデータが変更されます。

データの結合とユニオン

データ結合とは、共通のフィールドまたはキーに基づいて、2つ以上の関連テーブルからデータを組み合わせることです。

  1. 複数のテーブルを結合するには、関連テーブルをキャンバス上の既存のテーブルの横にドラッグし、結合ボックスに配置します。
  2. 両方のテーブルに存在する外部キーを選択します。

準備したデータのエクスポート

クレンジング、フィルタリング、変換、結合を行った後、Tableau でビジュアライズするためにデータをエクスポートできます。

  1. その他必要な変換を追加し、フローの最後に出力ノードを挿入します。
  2. 選択した形式でファイルに保存するようにノードを設定します。

出力データが保存されたら、他のファイルソースと同様に Tableau で操作できます。

CData Tableau Connector for Apache Hive と Tableau Prep Builder を使用すると、Hive のデータ の結合、クレンジング、フィルタリング、集計を簡単に行い、Tableau でビジュアライゼーションやレポートを作成できます。30日間の無料トライアルをダウンロードして、今すぐ始めましょう。

はじめる準備はできましたか?

Apache Hive Tableau Connector の無料トライアルをダウンロードしてお試しください:

 ダウンロード

詳細:

Apache Hive Icon Apache Hive Tableau Connector お問い合わせ

Tableau から最速でApache Hive データに接続。高度なデータ接続、リアルタイム連携、包括的なメタデータ、協力なSQL-92 サポートでデータ連携を支援します。