DBArtisan で Hugging Face のデータ を JDBC データソースとして管理
CData JDBC Driver for Hugging Face を使えば、Hugging Face のデータ をデータベースとしてアクセスできるようになり、DBArtisan などのデータベース管理ツールとシームレスに連携できます。この記事では、DBArtisan で Hugging Face の JDBC データソースを作成する方法を説明します。一度接続すれば、データを視覚的に編集したり、標準 SQL を実行したりすることができます。
Hugging Face のデータ を DBArtisan プロジェクトに統合
以下のステップに従って、プロジェクトに Hugging Face のデータ をデータベースインスタンスとして登録します。
- DBArtisan で、Data Source -> Register Datasource をクリックします。
- Generic JDBC を選択します。
- Manage をクリックします。
- 表示されたダイアログで、New をクリックします。ドライバーの名前を入力し、Add をクリックします。次に表示されるダイアログで、ドライバー JAR ファイルを指定します。ドライバー JAR はインストールディレクトリの lib サブフォルダ内にあります。
-
Connection URL ボックスに、資格情報やその他の必要な接続プロパティを JDBC URL 形式で入力します。
HuggingFace Hub は、API へのアクセスを可能にするためにトークンベースの認証を使用します。この API では、HuggingFace Hub プラットフォーム上の機械学習モデル、データセット、スペース、論文、その他のリソースにアクセスできます。
API キー認証の設定
HuggingFace Hub への認証には、API Key(アクセストークン)を指定する必要があります。アクセストークンを取得するには、以下のステップで進めます:
- https://huggingface.co で HuggingFace アカウントにログインします
- Settings > Access Tokens に移動します
- 「New token」をクリックして新しいアクセストークンを作成します
- 適切な権限(read または write)を選択します
- トークンの値をコピーします
アクセストークンを取得したら、以下の接続プロパティを設定します:
- AuthScheme:APIKey に設定します。
- APIKey:HuggingFace のアクセストークンに設定します。
接続文字列の例
Profile=C:\profiles\HuggingFace.apip;ProfileSettings='APIKey=hf_xxxxxxxxxxxxxxxxxxxx';
組み込みの接続文字列デザイナー
JDBC URL の構成には、Hugging Face JDBC Driver に組み込まれている接続文字列デザイナーを使用できます。JAR ファイルをダブルクリックするか、コマンドラインから JAR ファイルを実行します。
java -jar cdata.jdbc.api.jar
接続プロパティを入力し、接続文字列をクリップボードにコピーします。
一般的な接続文字列は以下のとおりです。
jdbc:api:Profile=C:\profiles\HuggingFace.apip;ProfileSettings='APIKey=hf_xxxxxxxxxxxxxxxxxxxx';
- ウィザードを完了して、Hugging Face のデータ に接続します。Hugging Face エンティティが Datasource Explorer に表示されます。
これで、他のデータベースと同じように Hugging Face のデータ を操作できます。 Hugging Face API でサポートされるクエリの詳細については、ドライバーのヘルプドキュメントを参照してください。