Domo Workbench のHugging Face からデータセットを作成し、Domo からHugging Face データに連携するビジュアライゼーションを作成

古川えりか
古川えりか
コンテンツスペシャリスト
Domo Workbench でHugging Face のデータ からデータセットを作成し、Domo サービスでビジュアライゼーションを作成するには、CData ODBC Driver for API を使用します。



Domo は、組織全体でデータを管理、分析、また共有し、組織が戦略的な機会を逃さず判断し対応することを実現するデータ活用プラットフォームです。Domo Workbench は、社内データをDomo にアップロードするための安全なクライアントサイドソリューションを提供します。CData ODBC Driver for API は、Domo Workbench をHugging Face のデータ に連携します。Workbench で標準のSQL クエリを使用してHugging Face のデータ からデータセットを構築し、Domo サービスでHugging Face のデータ のリアルタイムビジュアライゼーションを作成できます。

CData ODBC ドライバーは、最適化されたデータ処理がドライバーに組み込まれているため、Domo のライブHugging Face のデータとの連携に高いパフォーマンスを提供します。Domo からHugging Faceに複雑なSQL クエリを発行すると、ドライバーはフィルタや集計などのサポートされているSQL 操作を直接Hugging Faceにプッシュし、埋め込みSQL エンジンを利用してサポートされていない操作(SQL 関数やJOIN 操作)を処理します。 組み込みの動的メタデータクエリを使用すると、ネイティブのDomo データ型を使用してHugging Face のデータを視覚化および分析できます。

CData ODBC ドライバとは?

CData ODBC ドライバは、以下のような特徴を持ったリアルタイムデータ連携ソリューションです。

  1. Hugging Face をはじめとする、CRM、MA、会計ツールなど多様なカテゴリの270種類以上のSaaS / オンプレミスデータソースに対応
  2. 多様なアプリケーション、ツールにHugging Face のデータを連携
  3. ノーコードでの手軽な接続設定
  4. 標準 SQL での柔軟なデータ読み込み・書き込み

CData ODBC ドライバでは、1.データソースとしてHugging Face の接続を設定、2.Domo 側でODBC Driver との接続を設定、という2つのステップだけでデータソースに接続できます。以下に具体的な設定手順を説明します。

CData ODBC ドライバのインストールとHugging Face への接続設定

まずは、本記事右側のサイドバーからAPI ODBC Driver の無償トライアルをダウンロード・インストールしてください。30日間無償で、製品版の全機能が使用できます。

ODBC DSN (data source name) にて接続プロパティをまだ指定していない場合、指定します。ODBC DSN を作成し構成するために、Microsoft ODBC Data Source Administrator を利用できます。

HuggingFace Hub は、API へのアクセスを可能にするためにトークンベースの認証を使用します。この API では、HuggingFace Hub プラットフォーム上の機械学習モデル、データセット、スペース、論文、その他のリソースにアクセスできます。

API キー認証の設定

HuggingFace Hub への認証には、API Key(アクセストークン)を指定する必要があります。アクセストークンを取得するには、以下のステップで進めます:

  1. https://huggingface.co で HuggingFace アカウントにログインします
  2. Settings > Access Tokens に移動します
  3. 「New token」をクリックして新しいアクセストークンを作成します
  4. 適切な権限(read または write)を選択します
  5. トークンの値をコピーします

アクセストークンを取得したら、以下の接続プロパティを設定します:

  • AuthScheme:APIKey に設定します。
  • APIKey:HuggingFace のアクセストークンに設定します。

接続文字列の例

Profile=C:\profiles\HuggingFace.apip;ProfileSettings='APIKey=hf_xxxxxxxxxxxxxxxxxxxx';

DSN を構成する際、Max Rows の接続プロパティ設定が必要かもしれません。これにより返される行数を制限します。レポートやビジュアライゼーション(可視化)を設計する際のパフォーマンス向上に、とくに役立ちます。

DSN を作成したあと、Hugging Face DSN を用いDomo Workbench でHugging Face のデータセットを作成し、そのデータセットに基づきDomo サービスでビジュアライゼーションを構築する必要があります。

Hugging Face データのデータセットを作成

下記の手順に沿って、CData ODBC Driver for API を用いて Domo Workbench のHugging Face のテーブルに基づいたデータセットを構築できます。

  1. Domo Workbenchを開きます。まだDomo サービスサーバーをWorkbench に追加していない場合、追加します。Accounts のサブメニューより、Add New をクリック。サーバーアドレス(domain.domo.com など)を入力し、認証ウィザードからクリックします。 Connecting to the Domo Service.
  2. DataSet Jobs サブメニューから、Add New をクリックします。
  3. データセットジョブに名前をつけ(ODBC Hugging Face Collectionsなど)、変換方法としてODBC Connection Provider を選択、ウィザードからクリックします。 Configuring the DataSet Job.
  4. 新規に作成されたDataSet Job で、Source へ移動、設定を構成するためクリックします。
  5. Connection Type にSystem DSN を選択します。
  6. System DSN に以前構成したDSN (CData API Sys)を選択します。
  7. 構成を確定するためクリックします。 Configuring the Source Settings.
  8. 設定にて、Query をSQL クエリに設定します。
    SELECT * FROM Collections
    備考: ODBC ドライバーを利用しHugging Face のデータ データへ接続することで、データを取得するためにシンプルなSQL の知識だけで、Hugging Face 特有のAPI またはプロトコルを知る必要性がなくなります。
  9. Preview をクリックします。 Querying Hugging Face のデータ.
  10. 生成されたスキーマからデータを確認し、変更を加えます。それから、保存しデータセットのジョブを実行します。 Save and Run the Configured DataSet Job (Salesforce is shown).

データセットのジョブを実行すると、データセットはDomo サービスからアクセス可能になります。これにより、Hugging Face のデータ を基にした可視化、レポート作成、そしてさらにさまざまなことができるようになります。

データビジュアライゼーションを作成

DataSet Job を保存しDomo Workbench 上で実行すると、Domo サービス上で Hugging Face のデータ の可視化準備が完了です。

  1. Data Center へ移動します。 Accessing the Data Center (Salesforce is shown).
  2. データウェアハウスにて、ODBC データソースを選択し、新しいデータセットへドリルダウンします。 Selecting the Hugging Face Dataset (Salesforce is shown).
  3. データセットを選択し、Create a visualization を選びます。
  4. 新しいカードで、下記を実行します。
    • Dimension をX Value へドラッグ。
    • Measure をY Value へドラッグ。
    • Visualization を選択。
    Visualizing Hugging Face データin Domo (Salesforce is shown).

おわりに

このようにCData ODBC ドライバと併用することで、270を超えるSaaS、NoSQL データをコーディングなしで扱うことができます。30日の無償評価版が利用できますので、ぜひ自社で使っているクラウドサービスやNoSQL と合わせて活用してみてください。

CData ODBC ドライバは日本のユーザー向けに、UI の日本語化、ドキュメントの日本語化、日本語でのテクニカルサポートを提供しています。

はじめる準備はできましたか?

API Driver で Hugging Face のライブデータに接続

Hugging Face に接続