【MCP Server】Claude でDatabricks のデータと会話しよう!(CData Connect AI)
Claude は、AI 研究企業 Anthropic が開発した高度な大規模言語モデル (LLM) です。高い推論能力と安全性を兼ね備えたモデルとして注目を集めています。自然な対話が得意で、長文の文書理解や複雑なタスクの実行に優れた性能を発揮します。
CData Connect AI は、Databricks のデータに接続するための専用クラウド間インターフェースを提供します。CData Connect AI Remote MCP Server により、Google ADK エージェントと Databricksの間でセキュアな通信が可能になります。これにより、ネイティブ対応データベースへのデータレプリケーションを必要とせずに、エージェントから Databricks のデータの読み取りや操作を実行できます。CData Connect AIは最適化されたデータ処理機能を備えており、フィルタや JOIN を含むサポート対象のすべての SQL 操作を効率的に Databricksへ直接送信します。サーバーサイド処理を活用することで、要求されたDatabricks のデータ を迅速に取得できます。
Databricks データ連携について
CData を使用すれば、Databricks のライブデータへのアクセスと統合がこれまでになく簡単になります。お客様は CData の接続機能を以下の目的で利用しています:
- Runtime バージョン 9.1 - 13.X から Pro および Classic Databricks SQL バージョンまで、すべてのバージョンの Databricks にアクセスできます。
- あらゆるホスティングソリューションとの互換性により、お好みの環境で Databricks を使用し続けることができます。
- パーソナルアクセストークン、Azure サービスプリンシパル、Azure AD など、さまざまな方法で安全に認証できます。
- Databricks ファイルシステム、Azure Blob ストレージ、AWS S3 ストレージを使用して Databricks にデータをアップロードできます。
多くのお客様が、さまざまなシステムから Databricks データレイクハウスにデータを移行するために CData のソリューションを使用していますが、ライブ接続ソリューションを使用して、データベースと Databricks 間の接続をフェデレートしているお客様も多数います。これらのお客様は、SQL Server リンクサーバーまたは Polybase を使用して、既存の RDBMS 内から Databricks へのライブアクセスを実現しています。
一般的な Databricks のユースケースと CData のソリューションがデータの問題解決にどのように役立つかについては、ブログをご覧ください:What is Databricks Used For? 6 Use Cases
はじめに
※本記事ではConnect AI のリモートMCP 機能を使ってClaude とDatabricks を連携する方法をご紹介します。ローカルPC にMCP Server をインストールして利用したい場合にはこちらの記事をご確認ください。
ステップ1:Claude 用の Databricks への接続を設定
それでは早速、Claude から CData Connect AI のリモートMCP を介して Databricks に接続していきましょう。まずは Connect AI で Databricks への接続を設定します。
- Connect AI にログインして「Sources」をクリック、次に「 Add Connection」をクリック
- 接続を追加パネルから「Databricks」を選択
- Databricks に接続するために必要な認証プロパティを入力します。
Databricks 接続プロパティの取得・設定方法
Databricks クラスターに接続するには、以下のプロパティを設定します。
- Database:Databricks データベース名。
- Server:Databricks クラスターのサーバーのホスト名。
- HTTPPath:Databricks クラスターのHTTP パス。
- Token:個人用アクセストークン。この値は、Databricks インスタンスのユーザー設定ページに移動してアクセストークンタブを選択することで取得できます。
Databricks への認証
CData は、次の認証スキームをサポートしています。
- 個人用アクセストークン
- Microsoft Entra ID(Azure AD)
- Azure サービスプリンシパル
- OAuthU2M
- OAuthM2M
個人用アクセストークン
認証するには、次を設定します。
- AuthScheme:PersonalAccessToken。
- Token:Databricks サーバーへの接続に使用するトークン。Databricks インスタンスのユーザー設定ページに移動してアクセストークンタブを選択することで取得できます。
その他の認証方法については、ヘルプドキュメント の「はじめに」セクションを参照してください。
- 「Save & Test」をクリック
これで、Claude から Databricks に接続する準備が整いました!
ステップ2:Claude を CData Connect AI に接続
それでは、Claude に CData Connect AI コネクタを追加していきましょう。
- Claude.ai にサインインします。
- 左側のナビゲーションメニューを展開します。
- 左下隅のユーザー名をクリックし、メニューから「設定」を選択します。
- 設定画面で、「コネクタ」をクリックします。
- 右上隅のボタントグルを「組織のコネクタ」に設定します。
- ページ下部の「カスタムコネクタを追加」をクリックします。
- コネクタの名前を入力します (例: Connect AI MCP)。
- 「リモートMCPサーバー URL」フィールドに以下を入力します。
https://mcp.cloud.cdata.com/mcp
- 「追加」をクリックしてコネクタを保存します。Connect AI MCP コネクタが「コネクタ」の下に表示されます。
- コネクタの右側にある「連携/連携させる」をクリックし、CData Connect AI のユーザー名とパスワードを入力します。これで Claude からCData Connect AI に接続できました。
- 「連携済み」の後にある 3 つのドットをクリックし、「ツールと設定」を選択します。
- 提供されたツールを確認し、サーバーから利用可能な特定のツールを有効または無効にします。さらに、ツールへの無監視アクセスを許可するか、Claude に許可を求めるかを決定します。
- 設定が完了したら「完了」をクリックします。
これで設定は完了です!では、実際に Databricks のデータを探索してみましょう。
ステップ 3: Claude でDatabricks のデータをリアルタイムで探索
設定が完了したので、実際の業務に役立つ質問をいつでも聞くことができます。試してみましょう。
- Claude の左側のナビゲーションメニューで、「新規チャット」をクリックします。
- 自然言語のプロンプトでデータを探索・分析できます。Claude は Connect AI MCP を使用して Databricks のデータをリアルタイムにクエリします。例えば以下のようなプロンプトを試してみてください。
- 「過去30 日間のすべての顧客を表示して」
- 「最もパフォーマンスの高い製品は何ですか?」
- 「今四半期の売上トレンドを分析して」
- 「すべてのアクティブなプロジェクトと現在のステータスをリストして」
- Claude は自然言語のクエリを理解し、CData Connect AI のソースからデータを取得するために必要な手順を実行します。処理の流れも確認できるので、どのようにデータが取得されているかが分かりやすくなっています。
注意: Claude の設定プロセスは変更される可能性があります。最新の設定情報については、Claude のドキュメントをご参照ください。
CData Connect AI でビジネスシステムのデータ活用を今すぐスタート
いかがでしたか?Claude から Databricks へのデータ接続が 10 分もかからずに完了したのではないでしょうか。業務に使えそう、と感じてくださった方は、14 日間の無償トライアルで AI ツールからビジネスシステムへのリアルタイムデータ接続をぜひお試しください。