【MCP Server】ChatGPT でDatabricks のデータと会話しよう!

加藤龍彦
加藤龍彦
デジタルマーケティング
CData Connect AI のリモートMCP サーバーを活用して、ChatGPTがDatabricksに対して安全に質問への回答やアクションを実行できるようにします。

ChatGPTOpenAIが開発したAI アシスタントで、2022年11月にリリースされました。大規模言語モデル(LLM)をベースとして膨大な知識を持っており、業務のリサーチやコーディング、資料作成などに活用している方も多いのではないでしょうか。Plus およびPro 版で利用できるChatGPT の開発者モードで、外部データソースやツールに接続するためのMCP(Model Context Protocol)をサポートしています。

CData Connect AI は、Databricks のデータに接続するための専用クラウド間インターフェースを提供します。CData Connect AI Remote MCP Server により、Google ADK エージェントと Databricksの間でセキュアな通信が可能になります。これにより、ネイティブ対応データベースへのデータレプリケーションを必要とせずに、エージェントから Databricks のデータの読み取りや操作を実行できます。CData Connect AIは最適化されたデータ処理機能を備えており、フィルタや JOIN を含むサポート対象のすべての SQL 操作を効率的に Databricksへ直接送信します。サーバーサイド処理を活用することで、要求されたDatabricks のデータ を迅速に取得できます。

Databricks データ連携について

CData を使用すれば、Databricks のライブデータへのアクセスと統合がこれまでになく簡単になります。お客様は CData の接続機能を以下の目的で利用しています:

  • Runtime バージョン 9.1 - 13.X から Pro および Classic Databricks SQL バージョンまで、すべてのバージョンの Databricks にアクセスできます。
  • あらゆるホスティングソリューションとの互換性により、お好みの環境で Databricks を使用し続けることができます。
  • パーソナルアクセストークン、Azure サービスプリンシパル、Azure AD など、さまざまな方法で安全に認証できます。
  • Databricks ファイルシステム、Azure Blob ストレージ、AWS S3 ストレージを使用して Databricks にデータをアップロードできます。

多くのお客様が、さまざまなシステムから Databricks データレイクハウスにデータを移行するために CData のソリューションを使用していますが、ライブ接続ソリューションを使用して、データベースと Databricks 間の接続をフェデレートしているお客様も多数います。これらのお客様は、SQL Server リンクサーバーまたは Polybase を使用して、既存の RDBMS 内から Databricks へのライブアクセスを実現しています。

一般的な Databricks のユースケースと CData のソリューションがデータの問題解決にどのように役立つかについては、ブログをご覧ください:What is Databricks Used For? 6 Use Cases


はじめに


ステップ1: ChatGPT 用のDatabricks への接続を設定

ChatGPT からCData Connect AI のリモートMCP を介してDatabricks に接続していきます。まずはConnect AI でDatabricks への接続を設定します。

  1. Connect AI にログインして「Sources」をクリック、次に「 Add Connection」をクリック
  2. 接続を追加パネルから「Databricks」を選択
  3. Databricksに接続するために必要な認証プロパティを入力します。

    Databricks 接続プロパティの取得・設定方法

    Databricks クラスターに接続するには、以下のプロパティを設定します。

    • Database:Databricks データベース名。
    • Server:Databricks クラスターのサーバーのホスト名
    • HTTPPath:Databricks クラスターのHTTP パス。
    • Token:個人用アクセストークン。この値は、Databricks インスタンスのユーザー設定ページに移動してアクセストークンタブを選択することで取得できます。
    Databricks インスタンスで必要な値は、クラスターに移動して目的のクラスターを選択し、Advanced Options の下にあるJDBC/ODBC タブを選択することで見つけることができます。

    Databricks への認証

    CData は、次の認証スキームをサポートしています。

    • 個人用アクセストークン
    • Microsoft Entra ID(Azure AD)
    • Azure サービスプリンシパル
    • OAuthU2M
    • OAuthM2M

    個人用アクセストークン

    認証するには、次を設定します。

    • AuthSchemePersonalAccessToken
    • Token:Databricks サーバーへの接続に使用するトークン。Databricks インスタンスのユーザー設定ページに移動してアクセストークンタブを選択することで取得できます。

    その他の認証方法については、ヘルプドキュメント の「はじめに」セクションを参照してください。

  4. 「Save & Test」をクリック

これで、ChatGPT からDatabricks に接続する準備が整いました!

ステップ2: ChatGPT をCData Connect AI に接続

それでは、ChatGPT にCData Connect AI コネクタを追加していきましょう。注意点として、以下の操作の実行にはChatGPT のPlus またはPro サブスクリプションが必要になります。

  1. ChatGPTにサインインします。
  2. 「設定」 > 「アプリとコネクター」に移動します。
  3. 「高度な設定」セクションで、「開発者モード」をオンに切り替えます。
  4. 開発者モードが有効になったら、「アプリとコネクター」ページに戻り、「作成する」をクリックします。
  5. コネクタの名前を入力します(例: Connect AI MCP)。
  6. 「MCP Serverの URL」フィールドに以下を入力します。
    https://mcp.cloud.cdata.com/mcp
  7. 「認証」を「OAuth」に設定します。
  8. 「わたしはこのアプリケーションを信頼します」にチェックを入れ、「作成する」をクリックします
  9. CData Connect AI のOAuth 認証ページにリダイレクトされます。Connect AI の認証情報でサインインします。
  10. 要求された権限を確認し、「認証する」をクリックしてChatGPT にConnect AI リソースへのアクセスを許可します。
  11. 認証が成功すると、ChatGPT にリダイレクトされます。
  12. Connect AI MCP Server が利用可能なコネクタリストに表示され、コネクタの管理やアクション(ツール)の有効化・無効化ができるようになります。

これで設定は完了です!では、実際にDatabricks のデータを探索してみましょう。

ステップ3: ChatGPT でDatabricks のデータをリアルタイムで探索

設定が完了したので、実際の業務に役立つ質問をいつでも聞くことができます。試してみましょう。

  1. ChatGPT で新しい会話を開始します。
  2. ツールピッカーで「開発者モード」を有効にします。
  3. 「+」ボタンから「Connect AI MCP」を有効にします。
  4. 自然言語のプロンプトでデータの探索を開始できます。ChatGPT はConnect AI MCP を使用してDatabricks のデータをリアルタイムにクエリします。例えば以下のようなプロンプトを試してみてください。
    • 「過去30日間のすべての顧客を表示して」
    • 「最もパフォーマンスの高い製品は何ですか?」
    • 「今四半期の売上トレンドを分析して」
    • 「すべてのアクティブなプロジェクトと現在のステータスをリストして」
    その他多くのプロンプトアイデアを、CData のプロンプトライブラリで用意しています。
  5. ChatGPT は自然言語のクエリを自動でSQL に変換し、Connect AI を通じてDatabricks データを取得・分析します。

重要:ChatGPTの開発者モードは読み取り/書き込み権限を提供します。Databricks への書き込み操作を許可する際は注意してください。データの変更を許可する前に必ず内容を確認してください。

注意: 開発者モードはベータ版であり、ChatGPT Plus およびPro 版でのみ利用できます。最新のセットアップ情報については、OpenAIのドキュメントをご参照ください。

CData Connect AI でビジネスシステムのデータ活用を今すぐスタート

いかがでしたか?ChatGPT からDatabricks へのデータ接続が10分もかからずに完了したのではないでしょうか。業務に使えそう、と感じてくださった方は、14日間の無償トライアルでAI ツールからビジネスシステムへのリアルタイムデータ接続をぜひお試しください。

はじめる準備はできましたか?

CData Connect AI の詳細、または無料トライアルにお申し込みください:

無料トライアル お問い合わせ