Amazon QuickSight で MySQL 接続を使用して Hugging Face のデータにアクセス
Amazon QuickSight を使用すると、AWS データソース、アップロードしたファイル、クラウド上の他のデータベースからビジュアライゼーションの構築、分析の実行、インサイトの取得を素早く行うことができます。CData SQL Gateway と組み合わせることで、オンプレミスとクラウドの両方で数百種類のビッグデータ、NoSQL、SaaS ソースに対して同じ機能を利用できます。本記事では、SQL Gateway と CData ODBC Driver for Hugging Face を使用して、Amazon QuickSight の MySQL 接続経由でHugging Face のデータにアクセスする方法を説明します。直接クエリを使用したリアルタイムアクセス、または SPICE へのデータインポートのどちらも可能です。
Hugging Face のデータに接続
まだ行っていない場合は、データソース名(DSN)で必要な接続プロパティの値を指定してください。組み込みの Microsoft ODBC データソースアドミニストレーターを使用して DSN を設定できます。これはドライバーインストールの最後のステップでもあります。Microsoft ODBC データソースアドミニストレーターを使用して DSN を作成・設定する方法については、ヘルプドキュメントの「はじめに」の章を参照してください。
HuggingFace Hub は、API へのアクセスを可能にするためにトークンベースの認証を使用します。この API では、HuggingFace Hub プラットフォーム上の機械学習モデル、データセット、スペース、論文、その他のリソースにアクセスできます。
API キー認証の設定
HuggingFace Hub への認証には、API Key(アクセストークン)を指定する必要があります。アクセストークンを取得するには、以下のステップで進めます:
- https://huggingface.co で HuggingFace アカウントにログインします
- Settings > Access Tokens に移動します
- 「New token」をクリックして新しいアクセストークンを作成します
- 適切な権限(read または write)を選択します
- トークンの値をコピーします
アクセストークンを取得したら、以下の接続プロパティを設定します:
- AuthScheme:APIKey に設定します。
- APIKey:HuggingFace のアクセストークンに設定します。
接続文字列の例
Profile=C:\profiles\HuggingFace.apip;ProfileSettings='APIKey=hf_xxxxxxxxxxxxxxxxxxxx';
DSN を設定する際に、Max Rows 接続プロパティも設定することをお勧めします。これにより返される行数を制限でき、レポートやビジュアライゼーションを設計する際のパフォーマンス向上に特に効果的です。
SQL Gateway を設定
SQL Gateway 概要を参照して、Hugging Face のデータ を仮想 MySQL データベースとして接続を設定してください。クライアントからの MySQL リクエストをリッスンする MySQL リモーティングサービスを設定します。サービスは SQL Gateway UI で設定できます。
QuickSight から SQL Gateway に接続するには、インターネット接続可能なマシンで SQL Gateway を実行する必要があります。SQL Gateway を設定した後、以下の情報をメモしておいてください。
- SQL Gateway をホストしているマシンの IP アドレスまたはドメイン名
- MySQL サービスのデータソース名(通常は CData API Sys)
- MySQL サービスのポート番号
- サービスへのアクセス権を持つ SQL Gateway ユーザーの資格情報
リモートアクセスの設定
ODBC Driver とリモーティングサービスがオンプレミスにインストールされている(Amazon QuickSight からアクセスできない)場合は、リバース SSH トンネリング機能を使用してリモートアクセスを有効にできます。詳細な手順については、Knowledge Base の記事「SQL Gateway SSH トンネリング機能」を参照してください。
QuickSight で Hugging Face に接続
Hugging Face ODBC Driver 用に MySQL サービスを設定したら、QuickSight でデータに接続する準備が整いました。QuickSight コンソールにログインし、「Manage Data」をクリックしてから「New Data Set」をクリックし、データソースとして MySQL を選択します。
SQL Gateway で設定した Hugging Face 用の MySQL サービスの値を使用してデータセットを設定します(データベース名には DSN を使用してください)。接続を検証し、「Create Data Source」をクリックします。
QuickSight で Hugging Face のデータを可視化
本記事では、データビジュアライゼーションにカスタム SQL クエリを使用します。「Edit/Preview Data」をクリックし、表示される Data Prep 画面で以下の手順に従います。
- データセットに名前を付けます(例:Collections)。
- データを QuickSight SPICE にインポートする場合は SPICE オプションをクリックします。そうでない場合は、QuickSight がデータを直接クエリします。
- Tables メニューの下で「Switch to Custom SQL Tool」をクリックします。
- SQL クエリに名前を付けます。
- カスタム SQL クエリを入力します。例:
SELECT , FROM Collections - 「Finish」をクリックします。
- 「Save & Visualize」をクリックします。
データセットを保存したら、ビジュアライゼーションを設定できます。可視化するカラムを選択し、ビジュアルタイプを選択します。ビジュアライゼーションは、名前からデータの集計方法までカスタマイズできます。
CData ODBC Driver for Hugging Face と SQL Gateway を使用すると、Amazon QuickSight でHugging Face のデータのデータビジュアライゼーションの構築や分析を簡単に行うことができます。オンプレミスのデータに AWS QuickSight からアクセスする方法など、ご質問がありましたらサポートチームまでお問い合わせください。