Agno を使って CData Connect AI 経由で Databricks のデータと対話する

Anusha M B
Anusha M B
Technical Marketing Engineer
CData Connect AI Remote MCP Server を活用して、Agno エージェントが Databricks のデータ に対して安全に質問やアクションを実行できるようにします。

Agno は、ツールを使って推論・計画・アクションを実行する AI エージェントを構築するための、開発者向け Python フレームワークです。 Agno はクリーンでコード駆動型のアーキテクチャを重視しており、エージェントランタイムを開発者が完全に制御できます。

CData Connect AI は、300 以上のエンタープライズデータソースを AI システムと連携させるための、セキュアなクラウド間インターフェースを提供します。 Connect AI を使用すると、リアルタイムの Databricks のデータ をレプリケーションなしでリモート MCP エンドポイント経由で公開できます。

このガイドでは、Agno Python SDK を使用して本番環境対応の Agno エージェントを構築します。 エージェントは streamable HTTP を使用して MCP 経由で CData Connect AI に接続し、利用可能なツールを動的に検出して、 リアルタイムの Databricks のデータ にクエリを実行します。

前提条件

  1. Python 3.9 以上
  2. CData Connect AI アカウント – こちらからサインアップまたはログイン
  3. 有効な認証情報を持つ Databricks アカウント
  4. LLM API キー(例:OpenAI

概要

プロセスの概要は以下のとおりです。

  1. 接続:CData Connect AI で Databricks 接続を設定します。
  2. 検出:MCP を使用して CData Connect AI が公開するツールを動的に取得します。
  3. クエリ:MCP ツールを Agno 関数としてラップし、リアルタイムの Databricks のデータ にクエリを実行します。

Databricks データ連携について

CData を使用すれば、Databricks のライブデータへのアクセスと統合がこれまでになく簡単になります。お客様は CData の接続機能を以下の目的で利用しています:

  • Runtime バージョン 9.1 - 13.X から Pro および Classic Databricks SQL バージョンまで、すべてのバージョンの Databricks にアクセスできます。
  • あらゆるホスティングソリューションとの互換性により、お好みの環境で Databricks を使用し続けることができます。
  • パーソナルアクセストークン、Azure サービスプリンシパル、Azure AD など、さまざまな方法で安全に認証できます。
  • Databricks ファイルシステム、Azure Blob ストレージ、AWS S3 ストレージを使用して Databricks にデータをアップロードできます。

多くのお客様が、さまざまなシステムから Databricks データレイクハウスにデータを移行するために CData のソリューションを使用していますが、ライブ接続ソリューションを使用して、データベースと Databricks 間の接続をフェデレートしているお客様も多数います。これらのお客様は、SQL Server リンクサーバーまたは Polybase を使用して、既存の RDBMS 内から Databricks へのライブアクセスを実現しています。

一般的な Databricks のユースケースと CData のソリューションがデータの問題解決にどのように役立つかについては、ブログをご覧ください:What is Databricks Used For? 6 Use Cases


はじめに


Step 1: CData Connect AI で Databricks を設定

Agno からリアルタイムの Databricks のデータ にクエリを実行するには、まず CData Connect AIDatabricks 接続を作成します。 この接続は CData Remote MCP Server 経由で公開されます。

  1. Connect AI にログインし、Sources をクリックしてから Add Connection をクリックします。
  2. Add Connection パネルから「Databricks」を選択します。
  3. 必要な認証プロパティを入力します。

    Databricks 接続プロパティの取得・設定方法

    Databricks クラスターに接続するには、以下のプロパティを設定します。

    • Database:Databricks データベース名。
    • Server:Databricks クラスターのサーバーのホスト名
    • HTTPPath:Databricks クラスターのHTTP パス。
    • Token:個人用アクセストークン。この値は、Databricks インスタンスのユーザー設定ページに移動してアクセストークンタブを選択することで取得できます。
    Databricks インスタンスで必要な値は、クラスターに移動して目的のクラスターを選択し、Advanced Options の下にあるJDBC/ODBC タブを選択することで見つけることができます。

    Databricks への認証

    CData は、次の認証スキームをサポートしています。

    • 個人用アクセストークン
    • Microsoft Entra ID(Azure AD)
    • Azure サービスプリンシパル
    • OAuthU2M
    • OAuthM2M

    個人用アクセストークン

    認証するには、次を設定します。

    • AuthSchemePersonalAccessToken
    • Token:Databricks サーバーへの接続に使用するトークン。Databricks インスタンスのユーザー設定ページに移動してアクセストークンタブを選択することで取得できます。

    その他の認証方法については、ヘルプドキュメント の「はじめに」セクションを参照してください。

    Create & Test をクリックします。
  4. Permissions タブを開き、ユーザーアクセスを設定します。

Personal Access Token の追加

Personal Access Token(PAT)は、Agno から CData Connect AI への MCP リクエストを認証するために使用されます。

  1. Settings を開き、Access Tokens に移動します。
  2. Create PAT をクリックします。
  3. 生成されたトークンを安全に保存します。

Step 2: 依存関係のインストールと環境変数の設定

Agno と MCP アダプターの依存関係をインストールします。LangChain は MCP ツールの互換性のためだけに含まれています。

pip install agno agno-mcp langchain-mcp-adapters

環境変数を設定します。

export CDATA_MCP_URL="https://mcp.cloud.cdata.com/mcp"
export CDATA_MCP_AUTH="Base64EncodedCredentials"
export OPENAI_API_KEY="your-openai-key"

「Base64EncodedCredentials」は、Connect AI ユーザーのメールアドレスと Personal Access Token をコロン(「:」)で結合し、Base64 エンコードした値です:Base64([email protected]:MY_CONNECT_AI_PAT)

Step 3: MCP 経由で CData Connect AI に接続

streamable HTTP を使用して MCP クライアントを作成します。これにより、CData Connect AI へのセキュアな接続が確立されます。

import os
from langchain_mcp_adapters.client import MultiServerMCPClient

mcp_client = MultiServerMCPClient(
  connections={
    "default": {
      "transport": "streamable_http",
      "url": os.environ["CDATA_MCP_URL"],
      "headers": {
        "Authorization": f"Basic {os.environ['CDATA_MCP_AUTH']}"
      }
    }
  }
)

Step 4: MCP ツールの検出

CData Connect AI は操作を MCP ツールとして公開します。これらは実行時に動的に取得されます。

langchain_tools = await mcp_client.get_tools()
for tool in langchain_tools:
  print(tool.name)

Step 5: MCP ツールを Agno 関数に変換

各 MCP ツールを Agno 関数としてラップし、エージェントで使用できるようにします。

注意:Agno がすべての推論、計画、ツール選択を行います。LangChain は CData Connect AI が公開するツールを利用するための軽量な MCP 互換レイヤーとしてのみ使用されます。

from agno.tools import Function

def make_tool_caller(lc_tool):
  async def call_tool(**kwargs):
    return await lc_tool.ainvoke(kwargs)
  return call_tool

Step 6: Agno エージェントを作成してリアルタイムの Databricks のデータ にクエリ

Agno がすべての推論、計画、ツール呼び出しを行います。LangChain は MCP 互換性以外の役割を果たしません。

from agno.agent import Agent
from agno.models.openai import OpenAIChat

agent = Agent(
  model=OpenAIChat(
    id="gpt-4o",
    temperature=0.2,
    api_key=os.environ["OPENAI_API_KEY"]
  ),
  tools=agno_tools,
  markdown=True
)

await agent.aprint_response(
  "Show me the top 5 records from the available data source"
)

if __name__ == "__main__":
    asyncio.run(main())

以下の結果は、Agno エージェントが CData Connect AI を通じて MCP ツールを呼び出し、リアルタイムの Databricks のデータ を返す様子を示しています。

これで、Agno エージェントを通じて自然言語でリアルタイムの Databricks のデータ にクエリを実行できるようになりました。


CData Connect AI の詳細

300 以上の SaaS、ビッグデータ、NoSQL ソースにクラウドアプリケーションから直接アクセスするには、 CData Connect AI をぜひお試しください。

はじめる準備はできましたか?

CData Connect AI の詳細、または無料トライアルにお申し込みください:

無料トライアル お問い合わせ