Tableau で Hugging Face のデータ のデータを可視化

Jerod Johnson
Jerod Johnson
Director, Technology Evangelism
Tableau Desktop BI ツールで Hugging Face のデータ に接続。



CData Drivers for Hugging Face を使用すると、標準データアクセス方法でビジネスインテリジェンスツール(Tableau など)と Hugging Face のデータを接続できます。 CData API Driver for JDBC は Windows およびMacOS 上のTableau からの接続をサポートします。この記事では、スキーマの検出と Hugging Face のデータ データへのリアルタイムクエリの実行方法について説明します。

Tableau で Hugging Face に接続

Tableau を起動する前に、.jar ファイルが正しいフォルダに配置されていることを確認してください。

  • Windows: C:\Program Files\Tableau\Drivers
  • MacOS: ~/Library/Tableau/Drivers

.jar ファイルを配置したら、すぐに接続を確立できます。

  1. Tableau を起動します。
  2. サーバーへその他 を選択します。
  3. その他のデータベース (JDBC) を選択します。
  4. URL フィールドに JDBC 接続文字列を入力します。
  5. HuggingFace Hub は、API へのアクセスを可能にするためにトークンベースの認証を使用します。この API では、HuggingFace Hub プラットフォーム上の機械学習モデル、データセット、スペース、論文、その他のリソースにアクセスできます。

    API キー認証の設定

    HuggingFace Hub への認証には、API Key(アクセストークン)を指定する必要があります。アクセストークンを取得するには、以下のステップで進めます:

    1. https://huggingface.co で HuggingFace アカウントにログインします
    2. Settings > Access Tokens に移動します
    3. 「New token」をクリックして新しいアクセストークンを作成します
    4. 適切な権限(read または write)を選択します
    5. トークンの値をコピーします

    アクセストークンを取得したら、以下の接続プロパティを設定します:

    • AuthScheme:APIKey に設定します。
    • APIKey:HuggingFace のアクセストークンに設定します。

    接続文字列の例

    Profile=C:\profiles\HuggingFace.apip;ProfileSettings='APIKey=hf_xxxxxxxxxxxxxxxxxxxx';
    

    組み込みの接続文字列デザイナー

    JDBC URL の構成を簡単にするには、Hugging Face JDBC Driver に組み込まれている接続文字列デザイナーをご利用ください。.jar ファイルをダブルクリックするか、コマンドラインから実行します。

    Windows の場合:

    java -jar 'C:\Program Files\CData[product_name]\lib\cdata.jdbc.api.jar'
    

    MacOS の場合:

    java -jar cdata.jdbc.api.jar
    

    接続プロパティを設定し、接続文字列をクリップボードにコピーします。

    JDBC URL を構成する際に、Max Rows 接続プロパティの設定をお勧めします。返される行数が制限されるため、特にレポートやビジュアライゼーションの設計時にパフォーマンスが向上します。

    以下は、デザイナーで作成したサンプル URL です。

    jdbc:api:Profile=C:\profiles\HuggingFace.apip;ProfileSettings='APIKey=hf_xxxxxxxxxxxxxxxxxxxx';
    
  6. サインイン をクリックします。

スキーマの検出とデータクエリ

  1. データベース プルダウンメニューから CData を選択します。
  2. スキーマ プルダウンメニューから CData を選択します。
  3. テーブルを結合エリアにドラッグします。複数のテーブルを含めることができます。
  4. 今すぐ更新 または 自動更新 を選択します。「今すぐ更新」はデータソースの最初の10,000 行をプレビューします(行数はRows テキストボックスで変更可能)。「自動更新」はプレビューエリアの変更を自動的に反映します。
  5. 「接続」メニューで ライブ オプションを選択すると、Tableau にデータのコピーをロードせず、リアルタイムデータを直接操作できます。
  6. ワークシートのタブをクリックします。カラムはデータ型に応じて「ディメンション」と「メジャー」に分類されます。CData ドライバーはデータ型を自動で検出するため、Tableau の強力なデータ処理および可視化機能を活用できます。
  7. ディメンション または メジャー エリアからフィールドを または にドラッグします。Tableau がカラムまたは行のヘッダーを作成します。
  8. 表示形式 タブからグラフの種類を選択します。選択したグラフが Tableau に表示されます。

CData API Driver for JDBC と Tableau を使用して、Hugging Face のデータ に対する堅牢なビジュアライゼーションとレポートを簡単に作成できます。30日間の無償トライアルをダウンロードして、今すぐお試しください。

はじめる準備はできましたか?

API Driver で Hugging Face のライブデータに接続

Hugging Face に接続