【MCP Server】OpenAI のPython SDK からPresto のデータと連携しよう!
OpenAI の Python SDK は、さまざまなデータソースとやり取りできるAI アプリケーションを構築するための強力な機能を提供しています。CData Connect AI のリモートMCP と組み合わせることで、自然言語クエリを通じてPresto とリアルタイムでやり取りできるインテリジェントなチャットアプリケーションを構築できます。この記事では、Connect AI のリモートMCP を使用してPresto に接続し、会話型AI を通じてPresto とやり取りする OpenAI API 対応のPython アプリケーションを作成する方法をご紹介します。
CData Connect AI は、Presto のデータに接続するための専用クラウド間インターフェースを提供します。CData Connect AI Remote MCP Server により、Google ADK エージェントと Prestoの間でセキュアな通信が可能になります。これにより、ネイティブ対応データベースへのデータレプリケーションを必要とせずに、エージェントから Presto のデータの読み取りや操作を実行できます。CData Connect AIは最適化されたデータ処理機能を備えており、フィルタや JOIN を含むサポート対象のすべての SQL 操作を効率的に Prestoへ直接送信します。サーバーサイド処理を活用することで、要求されたPresto のデータ を迅速に取得できます。
この記事では、自然言語を使用してデータを会話形式で探索(Vibe Query)できる OpenAI 対応 Python アプリケーションの設定方法をご紹介します。Connect AI を使用すれば、Presto に加えて、数百の他のデータソースにもアクセスできる AI アシスタントを構築できます。
Presto データ連携について
CData を使用すれば、Trino および Presto SQL エンジンのライブデータへのアクセスと統合がこれまでになく簡単になります。お客様は CData の接続機能を以下の目的で利用しています:
- Trino v345 以降(旧 PrestoSQL)および Presto v0.242 以降(旧 PrestoDB)のデータにアクセスできます。
- Trino または Presto インスタンスの基盤となるすべてのデータに対して読み取り・書き込みアクセスができます。
- 最大スループットのための最適化されたクエリ生成。
Presto と Trino により、ユーザーは単一のエンドポイントを通じてさまざまな基盤データソースにアクセスできます。CData の接続と組み合わせることで、ユーザーはインスタンスへの純粋な SQL-92 アクセスを取得し、ビジネスデータをデータウェアハウスに統合したり、Power BI や Tableau などのお気に入りのツールからライブデータに直接簡単にアクセスしたりできます。
多くの場合、CData のライブ接続は、ツールで利用可能なネイティブのインポート機能を上回ります。あるお客様は、レポートに必要なデータセットのサイズが大きいため、Power BI を効果的に使用できませんでした。同社が CData Power BI Connector for Presto を導入したところ、DirectQuery 接続モードを使用してリアルタイムでレポートを生成できるようになりました。
はじめに
ステップ 1:OpenAI アプリケーション用の Presto 接続を設定する
OpenAI アプリケーションからPresto への接続は、CData Connect AI のリモートMCP を通じて実現されます。OpenAI アシスタントからPresto とやり取りするために、まず CData Connect AI で Presto 接続を作成・設定していきましょう。
- Connect AI にログインし、「Sources」をクリックして、「Add Connection」をクリックします。
- 「Add Connection」パネルから「Presto」を選択します
-
Presto に接続するために必要な認証プロパティを入力します。
Presto への接続には、まずはServer およびPort を接続プロパティとして設定します。それ以外の追加項目は接続方式によって異なります。
TLS/SSL を有効化するには、UseSSL をTRUE に設定します。
LDAP で認証
LDAP で認証するには、次の接続プロパティを設定します:
- AuthScheme: LDAP に設定。
- User: LDAP で接続するユーザー名。
- Password: LDAP で接続するユーザーのパスワード。
Kerberos 認証
KERBEROS 認証を使う場合には、以下を設定します:
- AuthScheme: KERBEROS に設定。
- KerberosKDC: 接続するユーザーのKerberos Key Distribution Center (KDC) サービス。
- KerberosRealm: 接続するユーザーのKerberos Realm 。
- KerberosSPN: Kerberos Domain Controller のService Principal Name。
- KerberosKeytabFile: Kerberos principals とencrypted keys を含むKeytab file。
- User: Kerberos のユーザー。
- Password: Kerberos で認証するユーザーのパスワード。
- 「Create & Test」をクリックします
-
「Add Presto Connection」ページの「Permissions」タブに移動し、ユーザーベースの権限を更新します。
パーソナルアクセストークンの追加
パーソナルアクセストークン(PAT)は、OpenAI アプリケーションから Connect AI への接続を認証するために使用されます。アクセス制御の粒度を維持するために、サービスごとに個別のPAT を作成することをおすすめします。
- Connect AI アプリの右上にある歯車アイコン()をクリックして、設定ページを開きます。
- 設定ページの「Access Tokens」セクションに移動し、「Create PAT」をクリックします。
-
PAT に名前を付けて「Create」をクリックします。
- パーソナルアクセストークンは作成時にのみ表示されますので、必ずコピーして安全な場所に保管してください。
これで接続の設定とPAT の生成が完了しました。OpenAI アプリケーションからPresto に接続する準備が整いました。
ステップ 2:CData Connect AI 用にOpenAI Python アプリケーションを設定する
以下の手順に従って、CData Connect AI に接続するように OpenAI Python アプリケーションを設定していきましょう。事前構築済みのエージェントをこちらから使用できます。または、以下の手順に従って独自のエージェントを作成することもできます。
-
Python 3.8 以上がインストールされていることを確認し、必要な依存関係をインストールします。
pip install openai python-dotenv httpx
-
GitHub から OpenAI MCP クライアントをクローンまたはダウンロードします。
git clone https://github.com/CDataSoftware/openai-mcp-client.git cd openai-mcp-client
-
環境変数を設定します。プロジェクトのルートに .env ファイルを作成し、以下の変数を設定します:
OPENAI_API_KEY=YOUR_OPENAI_API_KEY MCP_SERVER_URL=https://mcp.cloud.cdata.com/mcp MCP_USERNAME=YOUR_EMAIL MCP_PASSWORD=YOUR_PAT OPENAI_MODEL=gpt-4YOUR_OPENAI_API_KEY を OpenAI API キーに、YOUR_EMAIL を Connect AI のメールアドレスに、YOUR_PAT をステップ 1 で作成したパーソナルアクセストークンに置き換えてください。 -
独自のアプリケーションを作成する場合は、CData Connect AI MCP Server に接続するための中核となる実装は以下のとおりです。
import os import asyncio import base64 from dotenv import load_dotenv from mcp_client import MCPServerStreamableHttp, MCPAgent # 環境変数を読み込む load_dotenv() async def main(): """[service] データとやり取りするためのメインチャットループ""" # 設定を取得 api_key = os.getenv('OPENAI_API_KEY') mcp_url = os.getenv('MCP_SERVER_URL', 'https://mcp.cloud.cdata.com/mcp') username = os.getenv('MCP_USERNAME', '') password = os.getenv('MCP_PASSWORD', '') model = os.getenv('OPENAI_MODEL', 'gpt-4') # MCP サーバー用の認証ヘッダーを作成 headers = {} if username and password: auth = base64.b64encode(f"{username}:{password}".encode()).decode() headers = {"Authorization": f"Basic {auth}"} # CData MCP Server に接続 async with MCPServerStreamableHttp( name="CData MCP Server", params={ "url": mcp_url, "headers": headers, "timeout": 30, "verify_ssl": True } ) as mcp_server: #[service] データにアクセスできる AI エージェントを作成 agent = MCPAgent( name="data_assistant", model=model, mcp_servers=[mcp_server], instructions="""あなたは CData Connect AI を通じてPresto データにアクセスできるデータクエリアシスタントです。 ユーザーが[service] をリアルタイムで探索・クエリできるようサポートしてください。 利用可能な MCP ツールを使用して以下を実行できます: - 利用可能なデータベースとスキーマの一覧表示 - テーブル構造の探索 - SQL クエリの実行 - データに関する洞察の提供 実行内容を常に説明し、結果を明確にフォーマットしてください。""", api_key=api_key ) await agent.initialize() print(f"接続完了!{len(agent._tools_cache)} 個のツールが利用可能です。") print(" [service] と会話してみましょう(終了するには 'exit' と入力): ") # 対話型チャットループ conversation = [] while True: user_input = input("あなた: ") if user_input.lower() in ['exit', 'quit']: break conversation.append({"role": "user", "content": user_input}) print("アシスタント: ", end="", flush=True) response = await agent.run(conversation) print(response["content"]) conversation.append({"role": "assistant", "content": response["content"]}) if __name__ == "__main__": asyncio.run(main()) -
OpenAI アプリケーションを実行します:
python client.py
- 自然言語クエリを使用してPresto とやり取りを開始してください。これで、OpenAI アシスタントは CData Connect AI MCP Server を通じてPresto にアクセスできるようになりました。
ステップ 3:ライブPresto データへのアクセスを備えたインテリジェントアプリケーションを構築する
OpenAI Python アプリケーションを設定して CData Connect AI に接続できたので、自然言語を使用してPresto とやり取りする高度な AI アシスタントを構築できます。MCP 統合により、OpenAI の高度な言語モデルを通じて、アプリケーションに強力なデータアクセス機能が提供されます。
アシスタントで使用可能な MCP ツール
OpenAI アシスタントは、以下の CData Connect AI MCP ツールにアクセスできます:
- queryData:接続されたデータソースに対して SQL クエリを実行
- execData:ストアドプロシージャを実行
- getCatalogs:利用可能なデータベース接続を取得
- getSchemas:特定のカタログのデータベーススキーマを一覧表示
- getTables:スキーマ内のテーブルを一覧表示
- getColumns:特定のテーブルの列情報を取得
- getPrimaryKeys:プライマリキー情報を取得
- getIndexes:テーブルのインデックス情報を取得
- getProcedures:利用可能なストアドプロシージャを一覧表示
ユースケース例
ライブのPresto アクセスを備えた OpenAI 対応アプリケーションでできることの例をいくつかご紹介します:
- 会話型分析:自然言語を使用して複雑なビジネスの質問に答えるチャットインターフェースを構築
- 自動化レポート:リアルタイムデータクエリに基づいて動的なレポートとサマリーを生成
- データディスカバリーアシスタント:SQL の知識がなくてもデータ構造を探索・理解できるようユーザーをサポート
- インテリジェントデータモニター:トレンドや異常を積極的に特定する AI アシスタントを作成
- カスタムクエリビルダー:会話型のやり取りを通じて複雑なクエリを作成できるように
アシスタントとのやり取り
実行すると、自然言語を通じて OpenAI アシスタントとやり取りできます。クエリの例:
- 「利用可能なすべてのデータベースを表示して」
- 「sales データベースにはどんなテーブルがある?」
- 「売上トップ 10 の顧客をリストアップして」
- 「先月のすべての注文を検索して」
- 「過去四半期の売上トレンドを分析して」
- 「customer テーブルの構造は?」
OpenAI アシスタントは、これらの自然言語クエリを自動的に適切な SQL クエリに変換し、CData Connect AI MCP Server を通じてPresto データに対して実行します。複雑な SQL を記述したり、基盤となるデータ構造を理解したりすることなく、インテリジェントな洞察を提供できます。
高度な機能
OpenAI MCP 統合は、以下の高度な機能をサポートしています:
- コンテキスト認識:アシスタントは会話のコンテキストを維持し、フォローアップ質問に対応
- マルチターン会話:反復的な対話を通じて複雑なクエリを構築
- インテリジェントエラー処理:クエリで問題が発生した場合に役立つ提案を提供
- データインサイト:GPT の分析機能を活用してパターンやトレンドを特定
- 柔軟なフォーマット:さまざまな形式(テーブル、サマリー、JSON など)で結果をリクエスト
CData Connect AI でビジネスシステムのデータ活用を今すぐスタート
いかがでしたか?Mistral AI からPresto へのデータ接続が簡単に完了したのではないでしょうか。業務に使えそう、と感じてくださった方は、14 日間の無償トライアルで AI ツールからビジネスシステムへのリアルタイムデータ接続をぜひお試しください。