【MCP Server】ChatGPT でAzure Data Lake Storage のデータと会話しよう!
ChatGPT はOpenAIが開発したAI アシスタントで、2022年11月にリリースされました。大規模言語モデル(LLM)をベースとして膨大な知識を持っており、業務のリサーチやコーディング、資料作成などに活用している方も多いのではないでしょうか。Plus およびPro 版で利用できるChatGPT の開発者モードで、外部データソースやツールに接続するためのMCP(Model Context Protocol)をサポートしています。
CData Connect AI は、Azure Data Lake Storage のデータに接続するための専用クラウド間インターフェースを提供します。CData Connect AI Remote MCP Server により、Google ADK エージェントと Azure Data Lake Storageの間でセキュアな通信が可能になります。これにより、ネイティブ対応データベースへのデータレプリケーションを必要とせずに、エージェントから Azure Data Lake Storage のデータの読み取りや操作を実行できます。CData Connect AIは最適化されたデータ処理機能を備えており、フィルタや JOIN を含むサポート対象のすべての SQL 操作を効率的に Azure Data Lake Storageへ直接送信します。サーバーサイド処理を活用することで、要求されたAzure Data Lake Storage のデータ を迅速に取得できます。
ステップ1: ChatGPT 用のAzure Data Lake Storage への接続を設定
ChatGPT からCData Connect AI のリモートMCP を介してAzure Data Lake Storage に接続していきます。まずはConnect AI でAzure Data Lake Storage への接続を設定します。
- Connect AI にログインして「Sources」をクリック、次に「 Add Connection」をクリック
- 接続を追加パネルから「Azure Data Lake Storage」を選択
- Azure Data Lake Storageに接続するために必要な認証プロパティを入力します。
Azure Data Lake Storage 接続プロパティの取得・設定方法
Azure Data Lake Storage Gen2 への接続
それでは、Gen2 Data Lake Storage アカウントに接続していきましょう。接続するには、以下のプロパティを設定します。
- Account:ストレージアカウントの名前
- FileSystem:このアカウントに使用されるファイルシステム名。例えば、Azure Blob コンテナの名前
- Directory(オプション):レプリケートされたファイルが保存される場所へのパス。パスが指定されない場合、ファイルはルートディレクトリに保存されます
Azure Data Lake Storage Gen2への認証
続いて、認証方法を設定しましょう。CData 製品では、5つの認証方法をサポートしています:アクセスキー(AccessKey)の使用、共有アクセス署名(SAS)の使用、Azure Active Directory OAuth(AzureAD)経由、Azure サービスプリンシパル(AzureServicePrincipal またはAzureServicePrincipalCert)経由、およびManaged Service Identity(AzureMSI)経由です。
アクセスキー
アクセスキーを使用して接続するには、まずADLS Gen2ストレージアカウントで利用可能なアクセスキーを取得する必要があります。
Azure ポータルでの手順は以下のとおりです:
- ADLS Gen2ストレージアカウントにアクセスします
- 設定でアクセスキーを選択します
- 利用可能なアクセスキーの1つの値をAccessKey 接続プロパティにコピーします
接続の準備ができたら、以下のプロパティを設定してください。
- AuthScheme:AccessKey
- AccessKey:先ほどAzure ポータルで取得したアクセスキーの値
共有アクセス署名(SAS)
共有アクセス署名を使用して接続するには、まずAzure Storage Explorer ツールを使用して署名を生成する必要があります。
接続の準備ができたら、以下のプロパティを設定してください。
- AuthScheme:SAS
- SharedAccessSignature:先ほど生成した共有アクセス署名の値
その他の認証方法については、 href="/kb/help/" target="_blank">ヘルプドキュメントの「Azure Data Lake Storage Gen2への認証」セクションをご確認ください。
- 「Save & Test」をクリック
これで、ChatGPT からAzure Data Lake Storage に接続する準備が整いました!
ステップ2: ChatGPT をCData Connect AI に接続
それでは、ChatGPT にCData Connect AI コネクタを追加していきましょう。注意点として、以下の操作の実行にはChatGPT のPlus またはPro サブスクリプションが必要になります。
- ChatGPTにサインインします。
- 「設定」 > 「アプリとコネクター」に移動します。
- 「高度な設定」セクションで、「開発者モード」をオンに切り替えます。
- 開発者モードが有効になったら、「アプリとコネクター」ページに戻り、「作成する」をクリックします。
- コネクタの名前を入力します(例: Connect AI MCP)。
- 「MCP Serverの URL」フィールドに以下を入力します。
https://mcp.cloud.cdata.com/mcp
- 「認証」を「OAuth」に設定します。
- 「わたしはこのアプリケーションを信頼します」にチェックを入れ、「作成する」をクリックします
- CData Connect AI のOAuth 認証ページにリダイレクトされます。Connect AI の認証情報でサインインします。
- 要求された権限を確認し、「認証する」をクリックしてChatGPT にConnect AI リソースへのアクセスを許可します。
- 認証が成功すると、ChatGPT にリダイレクトされます。
- Connect AI MCP Server が利用可能なコネクタリストに表示され、コネクタの管理やアクション(ツール)の有効化・無効化ができるようになります。
これで設定は完了です!では、実際にAzure Data Lake Storage のデータを探索してみましょう。
ステップ3: ChatGPT でAzure Data Lake Storage のデータをリアルタイムで探索
設定が完了したので、実際の業務に役立つ質問をいつでも聞くことができます。試してみましょう。
- ChatGPT で新しい会話を開始します。
- ツールピッカーで「開発者モード」を有効にします。
- 「+」ボタンから「Connect AI MCP」を有効にします。
- 自然言語のプロンプトでデータの探索を開始できます。ChatGPT はConnect AI MCP を使用してAzure Data Lake Storage のデータをリアルタイムにクエリします。例えば以下のようなプロンプトを試してみてください。
- 「過去30日間のすべての顧客を表示して」
- 「最もパフォーマンスの高い製品は何ですか?」
- 「今四半期の売上トレンドを分析して」
- 「すべてのアクティブなプロジェクトと現在のステータスをリストして」
- ChatGPT は自然言語のクエリを自動でSQL に変換し、Connect AI を通じてAzure Data Lake Storage データを取得・分析します。
重要:ChatGPTの開発者モードは読み取り/書き込み権限を提供します。Azure Data Lake Storage への書き込み操作を許可する際は注意してください。データの変更を許可する前に必ず内容を確認してください。
注意: 開発者モードはベータ版であり、ChatGPT Plus およびPro 版でのみ利用できます。最新のセットアップ情報については、OpenAIのドキュメントをご参照ください。
CData Connect AI でビジネスシステムのデータ活用を今すぐスタート
いかがでしたか?ChatGPT からAzure Data Lake Storage へのデータ接続が10分もかからずに完了したのではないでしょうか。業務に使えそう、と感じてくださった方は、14日間の無償トライアルでAI ツールからビジネスシステムへのリアルタイムデータ接続をぜひお試しください。