Agno を使って CData Connect AI 経由で Azure Data Lake Storage のデータと対話する
Agno は、ツールを使って推論・計画・アクションを実行する AI エージェントを構築するための、開発者向け Python フレームワークです。 Agno はクリーンでコード駆動型のアーキテクチャを重視しており、エージェントランタイムを開発者が完全に制御できます。
CData Connect AI は、300 以上のエンタープライズデータソースを AI システムと連携させるための、セキュアなクラウド間インターフェースを提供します。 Connect AI を使用すると、リアルタイムの Azure Data Lake Storage のデータ をレプリケーションなしでリモート MCP エンドポイント経由で公開できます。
このガイドでは、Agno Python SDK を使用して本番環境対応の Agno エージェントを構築します。 エージェントは streamable HTTP を使用して MCP 経由で CData Connect AI に接続し、利用可能なツールを動的に検出して、 リアルタイムの Azure Data Lake Storage のデータ にクエリを実行します。
前提条件
- Python 3.9 以上
- CData Connect AI アカウント – こちらからサインアップまたはログイン
- 有効な認証情報を持つ Azure Data Lake Storage アカウント
- LLM API キー(例:OpenAI)
概要
プロセスの概要は以下のとおりです。
- 接続:CData Connect AI で Azure Data Lake Storage 接続を設定します。
- 検出:MCP を使用して CData Connect AI が公開するツールを動的に取得します。
- クエリ:MCP ツールを Agno 関数としてラップし、リアルタイムの Azure Data Lake Storage のデータ にクエリを実行します。
Step 1: CData Connect AI で Azure Data Lake Storage を設定
Agno からリアルタイムの Azure Data Lake Storage のデータ にクエリを実行するには、まず CData Connect AI で Azure Data Lake Storage 接続を作成します。 この接続は CData Remote MCP Server 経由で公開されます。
-
Connect AI にログインし、Sources をクリックしてから
Add Connection をクリックします。
-
Add Connection パネルから「Azure Data Lake Storage」を選択します。
-
必要な認証プロパティを入力します。
Azure Data Lake Storage 接続プロパティの取得・設定方法
Azure Data Lake Storage Gen2 への接続
それでは、Gen2 Data Lake Storage アカウントに接続していきましょう。接続するには、以下のプロパティを設定します。
- Account:ストレージアカウントの名前
- FileSystem:このアカウントに使用されるファイルシステム名。例えば、Azure Blob コンテナの名前
- Directory(オプション):レプリケートされたファイルが保存される場所へのパス。パスが指定されない場合、ファイルはルートディレクトリに保存されます
Azure Data Lake Storage Gen2への認証
続いて、認証方法を設定しましょう。CData 製品では、5つの認証方法をサポートしています:アクセスキー(AccessKey)の使用、共有アクセス署名(SAS)の使用、Azure Active Directory OAuth(AzureAD)経由、Azure サービスプリンシパル(AzureServicePrincipal またはAzureServicePrincipalCert)経由、およびManaged Service Identity(AzureMSI)経由です。
アクセスキー
アクセスキーを使用して接続するには、まずADLS Gen2ストレージアカウントで利用可能なアクセスキーを取得する必要があります。
Azure ポータルでの手順は以下のとおりです:
- ADLS Gen2ストレージアカウントにアクセスします
- 設定でアクセスキーを選択します
- 利用可能なアクセスキーの1つの値をAccessKey 接続プロパティにコピーします
接続の準備ができたら、以下のプロパティを設定してください。
- AuthScheme:AccessKey
- AccessKey:先ほどAzure ポータルで取得したアクセスキーの値
共有アクセス署名(SAS)
共有アクセス署名を使用して接続するには、まずAzure Storage Explorer ツールを使用して署名を生成する必要があります。
接続の準備ができたら、以下のプロパティを設定してください。
- AuthScheme:SAS
- SharedAccessSignature:先ほど生成した共有アクセス署名の値
その他の認証方法については、 href="/kb/help/" target="_blank">ヘルプドキュメントの「Azure Data Lake Storage Gen2への認証」セクションをご確認ください。
Create & Test をクリックします。
-
Permissions タブを開き、ユーザーアクセスを設定します。
Personal Access Token の追加
Personal Access Token(PAT)は、Agno から CData Connect AI への MCP リクエストを認証するために使用されます。
- Settings を開き、Access Tokens に移動します。
- Create PAT をクリックします。
-
生成されたトークンを安全に保存します。
Step 2: 依存関係のインストールと環境変数の設定
Agno と MCP アダプターの依存関係をインストールします。LangChain は MCP ツールの互換性のためだけに含まれています。
pip install agno agno-mcp langchain-mcp-adapters
環境変数を設定します。
export CDATA_MCP_URL="https://mcp.cloud.cdata.com/mcp" export CDATA_MCP_AUTH="Base64EncodedCredentials" export OPENAI_API_KEY="your-openai-key"
「Base64EncodedCredentials」は、Connect AI ユーザーのメールアドレスと Personal Access Token をコロン(「:」)で結合し、Base64 エンコードした値です:Base64([email protected]:MY_CONNECT_AI_PAT)
Step 3: MCP 経由で CData Connect AI に接続
streamable HTTP を使用して MCP クライアントを作成します。これにより、CData Connect AI へのセキュアな接続が確立されます。
import os
from langchain_mcp_adapters.client import MultiServerMCPClient
mcp_client = MultiServerMCPClient(
connections={
"default": {
"transport": "streamable_http",
"url": os.environ["CDATA_MCP_URL"],
"headers": {
"Authorization": f"Basic {os.environ['CDATA_MCP_AUTH']}"
}
}
}
)
Step 4: MCP ツールの検出
CData Connect AI は操作を MCP ツールとして公開します。これらは実行時に動的に取得されます。
langchain_tools = await mcp_client.get_tools() for tool in langchain_tools: print(tool.name)
Step 5: MCP ツールを Agno 関数に変換
各 MCP ツールを Agno 関数としてラップし、エージェントで使用できるようにします。
注意:Agno がすべての推論、計画、ツール選択を行います。LangChain は CData Connect AI が公開するツールを利用するための軽量な MCP 互換レイヤーとしてのみ使用されます。
from agno.tools import Function
def make_tool_caller(lc_tool):
async def call_tool(**kwargs):
return await lc_tool.ainvoke(kwargs)
return call_tool
Step 6: Agno エージェントを作成してリアルタイムの Azure Data Lake Storage のデータ にクエリ
Agno がすべての推論、計画、ツール呼び出しを行います。LangChain は MCP 互換性以外の役割を果たしません。
from agno.agent import Agent
from agno.models.openai import OpenAIChat
agent = Agent(
model=OpenAIChat(
id="gpt-4o",
temperature=0.2,
api_key=os.environ["OPENAI_API_KEY"]
),
tools=agno_tools,
markdown=True
)
await agent.aprint_response(
"Show me the top 5 records from the available data source"
)
if __name__ == "__main__":
asyncio.run(main())
以下の結果は、Agno エージェントが CData Connect AI を通じて MCP ツールを呼び出し、リアルタイムの Azure Data Lake Storage のデータ を返す様子を示しています。
これで、Agno エージェントを通じて自然言語でリアルタイムの Azure Data Lake Storage のデータ にクエリを実行できるようになりました。
CData Connect AI の詳細
300 以上の SaaS、ビッグデータ、NoSQL ソースにクラウドアプリケーションから直接アクセスするには、 CData Connect AI をぜひお試しください。