【MCP Server】Mistral AI からSpark のデータに連携しよう!
Mistral AI は、エンタープライズグレードのオープンソースおよび商用大規模言語モデル(LLM)を構築するフロンティアAI 企業です。Mistral を使えば、オンプレミス、クラウド、エッジなど、あらゆる場所でエージェントのトレーニング、ファインチューニング、デプロイが可能で、データの完全なコントロールを維持できます。エージェント対応プラットフォームは、多言語・マルチモーダル AI を実現し、メモリや拡張コンテキスト処理をサポートしながら、安全に検索、作成、コーディング、自動化、コラボレーションができます。
CData Connect AI は、Spark のデータに接続するための専用クラウド間インターフェースを提供します。CData Connect AI Remote MCP Server により、Google ADK エージェントと Sparkの間でセキュアな通信が可能になります。これにより、ネイティブ対応データベースへのデータレプリケーションを必要とせずに、エージェントから Spark のデータ の読み取りや操作を実行できます。CData Connect AIは最適化されたデータ処理機能を備えており、フィルタや JOIN を含むサポート対象のすべての SQL 操作を効率的に Sparkへ直接送信します。サーバーサイド処理を活用することで、要求されたSpark のデータ を迅速に取得できます。
この記事では、Mistral AI の Le Chat(Mistral のカスタマイズ可能な会話型チャットボット)と CData Connect AI を使用して、Spark に接続していきます。Mistral AI のワークフロー内でライブの Spark と直接やり取りでき、クエリの実行やタスクの自動化を安全に行えるようになります。
セットアップはわずか数分で完了し、接続が完了すればSpark のリアルタイムデータとインテリジェントに会話できる独自のチャットボットエージェントが完成します。
それでは、早速始めていきましょう。
前提条件
- Mistral AI アカウント(サインアップまたはログインはこちら)
- CData Connect AI アカウント(サインアップまたはログインはこちら)
- 有効な認証情報を持つアクティブな Spark アカウント
概要
実施する手順の概要を確認しておきましょう。
- 接続:CData Connect AI で認証情報を使用してSpark への接続を追加します。
- 設定:Mistral AI のLe Chat でカスタム MCP 接続を作成し、CData Connect AI の Spark 接続を指定します。
- クエリ:Mistral AI ワークフロー内でライブの Spark データとやり取りし、自然言語を使用してクエリを実行したりアクションを実行したりします。
ステップ1:Mistral 用の Spark 接続を設定する
Mistral AI から Spark への接続は、CData Connect AI のリモートMCP で実現します。Mistral から Spark とやり取りするために、まず CData Connect AI で Spark 接続を作成・設定していきましょう。
- Connect AI にログインし、Sources をクリックして、「Add Connection」をクリックします。
- 「Add Connection」パネルから「Spark」を選択します。
-
Spark に接続するために必要な認証プロパティを入力します。
SparkSQL への接続
SparkSQL への接続を確立するには以下を指定します。
- Server:SparkSQL をホストするサーバーのホスト名またはIP アドレスに設定。
- Port:SparkSQL インスタンスへの接続用のポートに設定。
- TransportMode:SparkSQL サーバーとの通信に使用するトランスポートモード。有効な入力値は、BINARY およびHTTP です。デフォルトではBINARY が選択されます。
- AuthScheme:使用される認証スキーム。有効な入力値はPLAIN、LDAP、NOSASL、およびKERBEROS です。デフォルトではPLAIN が選択されます。
Databricks への接続
Databricks クラスターに接続するには、以下の説明に従ってプロパティを設定します。Note:必要な値は、「クラスター」に移動して目的のクラスターを選択し、 「Advanced Options」の下にある「JDBC/ODBC」タブを選択することで、Databricks インスタンスで見つけることができます。
- Server:Databricks クラスターのサーバーのホスト名に設定。
- Port:443
- TransportMode:HTTP
- HTTPPath:Databricks クラスターのHTTP パスに設定。
- UseSSL:True
- AuthScheme:PLAIN
- User:'token' に設定。
- Password:パーソナルアクセストークンに設定(値は、Databricks インスタンスの「ユーザー設定」ページに移動して「アクセストークン」タブを選択することで取得できます)。
- 「Create & Test」をクリックします。
-
「Add Spark Connection」ページの Permissions タブに移動し、ユーザーベースの権限を更新します。
パーソナルアクセストークンの追加
パーソナルアクセストークン(PAT)は、Mistral AI から Connect AI への接続を認証するために使用されます。アクセス制御の粒度を維持するために、サービスごとに個別の PAT を作成することをおすすめします。
- Connect AI アプリの右上にある歯車アイコン()をクリックして、Settings ページを開きます。
- Settings ページの Access Tokens セクションに移動し、「Create PAT」をクリックします。
-
PAT にわかりやすい名前を付けて、Create をクリックします。
- ※PAT は作成時にのみ表示されますので、必ずコピーして安全な場所に保管してください。
これで接続の設定と PAT の生成が完了しました。Mistral AI ワークフローから Spark に接続する準備が整いました。
ステップ 2:Mistral Le Chat でMCP コネクタを設定する
CData Connect AI で Spark 接続とPAT を作成できたので、次は Mistral Le Chat 内でカスタム MCP コネクタを設定していきましょう。
-
Le Chat にログインします。
-
左側のメニューからIntelligence をクリックし、Connectors を選択します。Add Connector をクリックします。
-
ダイアログでCustom MCP Connector を選択し、以下の詳細を入力します。
- Connector Name:例:CData_Remote_MCP
- Connector Server:https://mcp.cloud.cdata.com/mcp(Connect AI の「Connect Data to AI」リボンに記載されています)
- Authentication Method:API Token Authentication
- Header Name:Authorization
- Header Type:Basic
- Header Value:[email protected]:YourPAT(「[email protected]」を CData Connect AI のメールアドレスに、「YourPAT」を先ほど作成した PAT に置き換えてください。上記の形式で指定します)
- Connect をクリックして接続を確立します。
-
Connections セクションの下部までスクロールして、MCP 接続が正常に確立されたことを確認します。
これで、Mistral Le Chat がCData Remote MCP Server を通じてSpark にリアルタイムでクエリをセキュアに連携できるようになりました。
ステップ 3:Mistral AI からSpark データをリアルタイムでクエリする
Le Chat でMCP コネクタの設定が完了したので、会話の中でSpark のデータを直接クエリできるようになりました。
- Le Chat で、左側のメニューの Chats をクリックして新しいチャットを開始します。
-
Enable Tools ボタンをクリックして MCP コネクタを有効化します。
-
Get Catalogs や Get Tables などのディスカバリークエリを実行して、CData Connect AI を通じて接続されている利用可能なデータソースとスキーマを確認してみましょう。
-
簡単なクエリを実行して接続をテストしてみてください。例えば:
「業種別の商談成約率を比較して」
これで完了です!Mistral Le Chat 内でSpark と会話形式でやり取りできるようになりました。
CData Connect AI で複雑な AI エージェントを構築する
統合が完了したら、シンプルなクエリを超えて、複数ステップの AI エージェントを構築できます。これらのエージェントは、Mistral AI の推論機能と CData Connect AI を通じたエンタープライズデータへの安全なリアルタイムアクセスを組み合わせることで、売上予測、サポートトリアージ、顧客トレンド分析など、さまざまなワークフローを実現できます。
CData Connect AI でビジネスシステムのデータ活用を今すぐスタート
いかがでしたか?Mistral AI から Spark へのデータ接続が簡単に完了したのではないでしょうか。業務に使えそう、と感じてくださった方は、14 日間の無償トライアルで AI ツールからビジネスシステムへのリアルタイムデータ接続をぜひお試しください。