【MCP Server】Mistral AI からDatabricks のデータに連携しよう!
Mistral AI は、エンタープライズグレードのオープンソースおよび商用大規模言語モデル(LLM)を構築するフロンティアAI 企業です。Mistral を使えば、オンプレミス、クラウド、エッジなど、あらゆる場所でエージェントのトレーニング、ファインチューニング、デプロイが可能で、データの完全なコントロールを維持できます。エージェント対応プラットフォームは、多言語・マルチモーダル AI を実現し、メモリや拡張コンテキスト処理をサポートしながら、安全に検索、作成、コーディング、自動化、コラボレーションができます。
CData Connect AI は、Databricks のデータに接続するための専用クラウド間インターフェースを提供します。CData Connect AI Remote MCP Server により、Google ADK エージェントと Databricksの間でセキュアな通信が可能になります。これにより、ネイティブ対応データベースへのデータレプリケーションを必要とせずに、エージェントから Databricks のデータ の読み取りや操作を実行できます。CData Connect AIは最適化されたデータ処理機能を備えており、フィルタや JOIN を含むサポート対象のすべての SQL 操作を効率的に Databricksへ直接送信します。サーバーサイド処理を活用することで、要求されたDatabricks のデータ を迅速に取得できます。
この記事では、Mistral AI の Le Chat(Mistral のカスタマイズ可能な会話型チャットボット)と CData Connect AI を使用して、Databricks に接続していきます。Mistral AI のワークフロー内でライブの Databricks と直接やり取りでき、クエリの実行やタスクの自動化を安全に行えるようになります。
セットアップはわずか数分で完了し、接続が完了すればDatabricks のリアルタイムデータとインテリジェントに会話できる独自のチャットボットエージェントが完成します。
それでは、早速始めていきましょう。
前提条件
- Mistral AI アカウント(サインアップまたはログインはこちら)
- CData Connect AI アカウント(サインアップまたはログインはこちら)
- 有効な認証情報を持つアクティブな Databricks アカウント
概要
実施する手順の概要を確認しておきましょう。
- 接続:CData Connect AI で認証情報を使用してDatabricks への接続を追加します。
- 設定:Mistral AI のLe Chat でカスタム MCP 接続を作成し、CData Connect AI の Databricks 接続を指定します。
- クエリ:Mistral AI ワークフロー内でライブの Databricks データとやり取りし、自然言語を使用してクエリを実行したりアクションを実行したりします。
Databricks データ連携について
CData を使用すれば、Databricks のライブデータへのアクセスと統合がこれまでになく簡単になります。お客様は CData の接続機能を以下の目的で利用しています:
- Runtime バージョン 9.1 - 13.X から Pro および Classic Databricks SQL バージョンまで、すべてのバージョンの Databricks にアクセスできます。
- あらゆるホスティングソリューションとの互換性により、お好みの環境で Databricks を使用し続けることができます。
- パーソナルアクセストークン、Azure サービスプリンシパル、Azure AD など、さまざまな方法で安全に認証できます。
- Databricks ファイルシステム、Azure Blob ストレージ、AWS S3 ストレージを使用して Databricks にデータをアップロードできます。
多くのお客様が、さまざまなシステムから Databricks データレイクハウスにデータを移行するために CData のソリューションを使用していますが、ライブ接続ソリューションを使用して、データベースと Databricks 間の接続をフェデレートしているお客様も多数います。これらのお客様は、SQL Server リンクサーバーまたは Polybase を使用して、既存の RDBMS 内から Databricks へのライブアクセスを実現しています。
一般的な Databricks のユースケースと CData のソリューションがデータの問題解決にどのように役立つかについては、ブログをご覧ください:What is Databricks Used For? 6 Use Cases
はじめに
ステップ1:Mistral 用の Databricks 接続を設定する
Mistral AI から Databricks への接続は、CData Connect AI のリモートMCP で実現します。Mistral から Databricks とやり取りするために、まず CData Connect AI で Databricks 接続を作成・設定していきましょう。
- Connect AI にログインし、Sources をクリックして、「Add Connection」をクリックします。
- 「Add Connection」パネルから「Databricks」を選択します。
-
Databricks に接続するために必要な認証プロパティを入力します。
Databricks 接続プロパティの取得・設定方法
Databricks クラスターに接続するには、以下のプロパティを設定します。
- Database:Databricks データベース名。
- Server:Databricks クラスターのサーバーのホスト名。
- HTTPPath:Databricks クラスターのHTTP パス。
- Token:個人用アクセストークン。この値は、Databricks インスタンスのユーザー設定ページに移動してアクセストークンタブを選択することで取得できます。
Databricks への認証
CData は、次の認証スキームをサポートしています。
- 個人用アクセストークン
- Microsoft Entra ID(Azure AD)
- Azure サービスプリンシパル
- OAuthU2M
- OAuthM2M
個人用アクセストークン
認証するには、次を設定します。
- AuthScheme:PersonalAccessToken。
- Token:Databricks サーバーへの接続に使用するトークン。Databricks インスタンスのユーザー設定ページに移動してアクセストークンタブを選択することで取得できます。
その他の認証方法については、ヘルプドキュメント の「はじめに」セクションを参照してください。
- 「Create & Test」をクリックします。
-
「Add Databricks Connection」ページの Permissions タブに移動し、ユーザーベースの権限を更新します。
パーソナルアクセストークンの追加
パーソナルアクセストークン(PAT)は、Mistral AI から Connect AI への接続を認証するために使用されます。アクセス制御の粒度を維持するために、サービスごとに個別の PAT を作成することをおすすめします。
- Connect AI アプリの右上にある歯車アイコン()をクリックして、Settings ページを開きます。
- Settings ページの Access Tokens セクションに移動し、「Create PAT」をクリックします。
-
PAT にわかりやすい名前を付けて、Create をクリックします。
- ※PAT は作成時にのみ表示されますので、必ずコピーして安全な場所に保管してください。
これで接続の設定と PAT の生成が完了しました。Mistral AI ワークフローから Databricks に接続する準備が整いました。
ステップ 2:Mistral Le Chat でMCP コネクタを設定する
CData Connect AI で Databricks 接続とPAT を作成できたので、次は Mistral Le Chat 内でカスタム MCP コネクタを設定していきましょう。
-
Le Chat にログインします。
-
左側のメニューからIntelligence をクリックし、Connectors を選択します。Add Connector をクリックします。
-
ダイアログでCustom MCP Connector を選択し、以下の詳細を入力します。
- Connector Name:例:CData_Remote_MCP
- Connector Server:https://mcp.cloud.cdata.com/mcp(Connect AI の「Connect Data to AI」リボンに記載されています)
- Authentication Method:API Token Authentication
- Header Name:Authorization
- Header Type:Basic
- Header Value:[email protected]:YourPAT(「[email protected]」を CData Connect AI のメールアドレスに、「YourPAT」を先ほど作成した PAT に置き換えてください。上記の形式で指定します)
- Connect をクリックして接続を確立します。
-
Connections セクションの下部までスクロールして、MCP 接続が正常に確立されたことを確認します。
これで、Mistral Le Chat がCData Remote MCP Server を通じてDatabricks にリアルタイムでクエリをセキュアに連携できるようになりました。
ステップ 3:Mistral AI からDatabricks データをリアルタイムでクエリする
Le Chat でMCP コネクタの設定が完了したので、会話の中でDatabricks のデータを直接クエリできるようになりました。
- Le Chat で、左側のメニューの Chats をクリックして新しいチャットを開始します。
-
Enable Tools ボタンをクリックして MCP コネクタを有効化します。
-
Get Catalogs や Get Tables などのディスカバリークエリを実行して、CData Connect AI を通じて接続されている利用可能なデータソースとスキーマを確認してみましょう。
-
簡単なクエリを実行して接続をテストしてみてください。例えば:
「業種別の商談成約率を比較して」
これで完了です!Mistral Le Chat 内でDatabricks と会話形式でやり取りできるようになりました。
CData Connect AI で複雑な AI エージェントを構築する
統合が完了したら、シンプルなクエリを超えて、複数ステップの AI エージェントを構築できます。これらのエージェントは、Mistral AI の推論機能と CData Connect AI を通じたエンタープライズデータへの安全なリアルタイムアクセスを組み合わせることで、売上予測、サポートトリアージ、顧客トレンド分析など、さまざまなワークフローを実現できます。
CData Connect AI でビジネスシステムのデータ活用を今すぐスタート
いかがでしたか?Mistral AI から Databricks へのデータ接続が簡単に完了したのではないでしょうか。業務に使えそう、と感じてくださった方は、14 日間の無償トライアルで AI ツールからビジネスシステムへのリアルタイムデータ接続をぜひお試しください。