DBArtisan でHugging Face のデータに連携

古川えりか
古川えりか
コンテンツスペシャリスト
DBArtisan のウィザードを使って、Hugging Face をデータソースとして連携利用。



CData ODBC Driver for API は、DBArtisan などのデータベースツールとHugging Face のデータ を連携し、RDB のような感覚でHugging Face のデータを扱えます。 本記事では、DBArtisan 上でHugging Face のデータソースを作成する方法とクエリの実行方法を説明します。

CData ODBC ドライバとは?

CData ODBC ドライバは、以下のような特徴を持ったリアルタイムデータ連携ソリューションです。

  1. Hugging Face をはじめとする、CRM、MA、会計ツールなど多様なカテゴリの270種類以上のSaaS / オンプレミスデータソースに対応
  2. 多様なアプリケーション、ツールにHugging Face のデータを連携
  3. ノーコードでの手軽な接続設定
  4. 標準 SQL での柔軟なデータ読み込み・書き込み

CData ODBC ドライバでは、1.データソースとしてHugging Face の接続を設定、2.DBArtisan 側でODBC Driver との接続を設定、という2つのステップだけでデータソースに接続できます。以下に具体的な設定手順を説明します。

CData ODBC ドライバのインストールとHugging Face への接続設定

まずは、本記事右側のサイドバーからAPI ODBC Driver の無償トライアルをダウンロード・インストールしてください。30日間無償で、製品版の全機能が使用できます。

インストール後にDSN 設定画面が開くので、Hugging Face への接続に必要なプロパティを設定します。

HuggingFace Hub は、API へのアクセスを可能にするためにトークンベースの認証を使用します。この API では、HuggingFace Hub プラットフォーム上の機械学習モデル、データセット、スペース、論文、その他のリソースにアクセスできます。

API キー認証の設定

HuggingFace Hub への認証には、API Key(アクセストークン)を指定する必要があります。アクセストークンを取得するには、以下のステップで進めます:

  1. https://huggingface.co で HuggingFace アカウントにログインします
  2. Settings > Access Tokens に移動します
  3. 「New token」をクリックして新しいアクセストークンを作成します
  4. 適切な権限(read または write)を選択します
  5. トークンの値をコピーします

アクセストークンを取得したら、以下の接続プロパティを設定します:

  • AuthScheme:APIKey に設定します。
  • APIKey:HuggingFace のアクセストークンに設定します。

接続文字列の例

Profile=C:\profiles\HuggingFace.apip;ProfileSettings='APIKey=hf_xxxxxxxxxxxxxxxxxxxx';

次の方法で、プロジェクトにHugging Face のデータソースを登録します。

  1. DBArtisan で「Data Source」->「Register Datasource」と進みます。
  2. 「Generic ODBC」を選択。
  3. データソース名を入力して、DSN を選択します。Enter a name for the data source and select the DSN. The DSN of the data source to be registered. (Salesforce is shown.)
  4. ウィザードを終了してHugging Face への接続を完了します。Hugging Face のエンティティが Datasource Explorer に表示されているはずです。 The Datasource Explorer. (Salesforce is shown.)

これで、他のデータベースと同じようにHugging Face のデータを扱うことが可能になります。 サポートされるSQL クエリは、ドライバーのヘルプドキュメントを参照してください。

The results of a query. (Salesforce is shown.)

おわりに

このようにCData ODBC ドライバと併用することで、270を超えるSaaS、NoSQL データをコーディングなしで扱うことができます。30日の無償評価版が利用できますので、ぜひ自社で使っているクラウドサービスやNoSQL と合わせて活用してみてください。

CData ODBC ドライバは日本のユーザー向けに、UI の日本語化、ドキュメントの日本語化、日本語でのテクニカルサポートを提供しています。

はじめる準備はできましたか?

API Driver で Hugging Face のライブデータに接続

Hugging Face に接続