JDBC で Hugging Face データソースから Informatica マッピングを作成
Informatica は、データの転送と変換を行う強力でエレガントな手段を提供します。CData JDBC Driver for Hugging Face を使用することで、業界で実績のある標準に基づいたドライバーにアクセスでき、Informatica の強力なデータ転送および操作機能とシームレスに統合できます。このチュートリアルでは、Informatica PowerCenter で Hugging Face のデータ を転送および参照する方法を説明します。
ドライバーのデプロイ
ドライバーを Informatica PowerCenter サーバーにデプロイするには、インストールディレクトリの lib サブフォルダにある CData JAR ファイルと .lic ファイルを、次のフォルダにコピーします:Informatica インストールディレクトリ\services\shared\jars\thirdparty。
Developer ツールで Hugging Face のデータ を使用するには、インストールディレクトリの lib サブフォルダにある CData JAR ファイルと .lic ファイルを、次のフォルダにコピーする必要があります:
- Informatica インストールディレクトリ\client\externaljdbcjars
- Informatica インストールディレクトリ\externaljdbcjars
JDBC 接続の作成
Informatica Developer から接続するには、次の手順に従います:
- Connection Explorer ペインで、ドメインを右クリックし、Create a Connection をクリックします。
- 表示される New Database Connection ウィザードで、接続の名前と ID を入力し、Type メニューで JDBC を選択します。
- JDBC Driver Class Name プロパティに、次のように入力します:
cdata.jdbc.api.APIDriver
- Connection String プロパティに、Hugging Face の接続プロパティを使用して JDBC URL を入力します。
HuggingFace Hub は、API へのアクセスを可能にするためにトークンベースの認証を使用します。この API では、HuggingFace Hub プラットフォーム上の機械学習モデル、データセット、スペース、論文、その他のリソースにアクセスできます。
API キー認証の設定
HuggingFace Hub への認証には、API Key(アクセストークン)を指定する必要があります。アクセストークンを取得するには、以下のステップで進めます:
- https://huggingface.co で HuggingFace アカウントにログインします
- Settings > Access Tokens に移動します
- 「New token」をクリックして新しいアクセストークンを作成します
- 適切な権限(read または write)を選択します
- トークンの値をコピーします
アクセストークンを取得したら、以下の接続プロパティを設定します:
- AuthScheme:APIKey に設定します。
- APIKey:HuggingFace のアクセストークンに設定します。
接続文字列の例
Profile=C:\profiles\HuggingFace.apip;ProfileSettings='APIKey=hf_xxxxxxxxxxxxxxxxxxxx';
組み込みの接続文字列デザイナー
JDBC URL の構築には、Hugging Face JDBC Driver に組み込まれている接続文字列デザイナーを使用できます。JAR ファイルをダブルクリックするか、コマンドラインから JAR ファイルを実行します。
java -jar cdata.jdbc.api.jar
接続プロパティを入力し、接続文字列をクリップボードにコピーします。
一般的な接続文字列は次のとおりです:
jdbc:api:Profile=C:\profiles\HuggingFace.apip;ProfileSettings='APIKey=hf_xxxxxxxxxxxxxxxxxxxx';
Hugging Face テーブルの参照
ドライバー JAR をクラスパスに追加し、JDBC 接続を作成したら、Informatica で Hugging Face エンティティにアクセスできます。Hugging Face に接続してテーブルを参照するには、次の手順に従います:
- リポジトリに接続します。
- Connection Explorer で、接続を右クリックし、Connect をクリックします。
- Show Default Schema Only オプションのチェックを外します。
これで、Data Viewer で Hugging Face テーブルを参照できます。テーブルのノードを右クリックし、Open をクリックします。Data Viewer ビューで、Run をクリックします。
Hugging Face データオブジェクトの作成
プロジェクトに Hugging Face テーブルを追加するには、次の手順に従います:
- Hugging Face でテーブルを選択し、テーブルを右クリックして Add to Project をクリックします。
- 表示されるダイアログで、各リソースに対してデータオブジェクトを作成するオプションを選択します。
- Select Location ダイアログで、プロジェクトを選択します。
マッピングの作成
マッピングに Hugging Face ソースを追加するには、次の手順に従います:
- Object Explorer で、プロジェクトを右クリックし、New -> Mapping をクリックします。
- Hugging Face 接続のノードを展開し、テーブルのデータオブジェクトをエディターにドラッグします。
- 表示されるダイアログで、Read オプションを選択します。
Hugging Face カラムをフラットファイルにマッピングするには、次の手順に従います:
- Object Explorer で、プロジェクトを右クリックし、New -> Data Object をクリックします。
- Flat File Data Object -> Create as Empty -> Fixed Width を選択します。
- Hugging Face オブジェクトのプロパティで、必要な行を選択し、右クリックして copy をクリックします。フラットファイルのプロパティに行を貼り付けます。
- フラットファイルデータオブジェクトをマッピングにドラッグします。表示されるダイアログで、Write オプションを選択します。
- クリック&ドラッグでカラムを接続します。
Hugging Face のデータ を転送するには、ワークスペース内で右クリックし、Run Mapping をクリックします。
