CData Connect AI 経由で Theia IDE からリアルタイムでDatabricks のデータにクエリ
Theia IDE は、柔軟で拡張性の高い開発環境を提供する、オープンソースのクラウド・デスクトップ対応 IDE プラットフォームです。組み込みの AI 機能は複数の LLM プロバイダーと MCP(Model Context Protocol)ツール連携をサポートしており、開発者は IDE 内のチャットベースのエージェントから直接、外部のライブデータソースとやり取りできます。
Theia IDE と CData Connect AI を組み込みの MCP サーバーを介して連携させると、Theia の AI エージェントがリアルタイムでDatabricks のデータにセキュアにアクセスできるようになります。エディタを離れることなく、カスタムの連携コードを書く必要もなく、カタログの一覧表示やスキーマの探索、Databricks のデータのレコードのクエリが可能です。
この記事では、Connect AI での Databricks 接続の設定、必要な Personal Access Token の生成、Theia IDE への CData Connect AI MCP サーバーの登録、LLM プロバイダーによる AI 機能の有効化、そして Theia AI Chat からリアルタイムでDatabricks のデータにクエリして連携を確認する方法を解説します。
Databricks データ連携について
CData を使用すれば、Databricks のライブデータへのアクセスと統合がこれまでになく簡単になります。お客様は CData の接続機能を以下の目的で利用しています:
- Runtime バージョン 9.1 - 13.X から Pro および Classic Databricks SQL バージョンまで、すべてのバージョンの Databricks にアクセスできます。
- あらゆるホスティングソリューションとの互換性により、お好みの環境で Databricks を使用し続けることができます。
- パーソナルアクセストークン、Azure サービスプリンシパル、Azure AD など、さまざまな方法で安全に認証できます。
- Databricks ファイルシステム、Azure Blob ストレージ、AWS S3 ストレージを使用して Databricks にデータをアップロードできます。
多くのお客様が、さまざまなシステムから Databricks データレイクハウスにデータを移行するために CData のソリューションを使用していますが、ライブ接続ソリューションを使用して、データベースと Databricks 間の接続をフェデレートしているお客様も多数います。これらのお客様は、SQL Server リンクサーバーまたは Polybase を使用して、既存の RDBMS 内から Databricks へのライブアクセスを実現しています。
一般的な Databricks のユースケースと CData のソリューションがデータの問題解決にどのように役立つかについては、ブログをご覧ください:What is Databricks Used For? 6 Use Cases
はじめに
ステップ 1:Theia IDE 用に Databricks への接続を設定
Theia IDE から Databricks への接続は、Connect AI のリモート MCP サーバーを介して実現します。Theia IDE からDatabricks のデータを操作するために、まずは Connect AI で Databricks への接続を作成・設定しましょう。
- Connect AI にログインし、Sources をクリック、次に Add Connection をクリック
- 接続を追加パネルから Databricks を選択
-
Databricks に接続するために必要な認証プロパティを入力します。
Databricks 接続プロパティの取得・設定方法
Databricks クラスターに接続するには、以下のプロパティを設定します。
- Database:Databricks データベース名。
- Server:Databricks クラスターのサーバーのホスト名。
- HTTPPath:Databricks クラスターのHTTP パス。
- Token:個人用アクセストークン。この値は、Databricks インスタンスのユーザー設定ページに移動してアクセストークンタブを選択することで取得できます。
Databricks への認証
CData は、次の認証スキームをサポートしています。
- 個人用アクセストークン
- Microsoft Entra ID(Azure AD)
- Azure サービスプリンシパル
- OAuthU2M
- OAuthM2M
個人用アクセストークン
認証するには、次を設定します。
- AuthScheme:PersonalAccessToken。
- Token:Databricks サーバーへの接続に使用するトークン。Databricks インスタンスのユーザー設定ページに移動してアクセストークンタブを選択することで取得できます。
その他の認証方法については、ヘルプドキュメント の「はじめに」セクションを参照してください。
- Save & Test をクリック
- Permissions タブに移動し、ユーザーベースのアクセス許可を設定
Personal Access Token の追加
Theia IDE から Connect AI への接続認証には、Personal Access Token(PAT)を使用します。アクセス制御の粒度を維持するために、連携ごとに個別の PAT を作成することをお勧めします。
- Connect AI 画面の右上にある歯車アイコン()をクリックして Settings を開きます
- Settings ページで Access Tokens セクションに移動し、 Create PAT をクリック
- PAT にわかりやすい名前を入力し、Create をクリック
- 表示されたトークンをコピーして安全に保存してください。トークンは作成時にのみ表示されます
Databricks の接続設定と PAT の生成が完了しました。これで Theia IDE から Connect AI を通じてDatabricks のデータに接続する準備が整いました。
ステップ 2:Theia IDE で Connect AI MCP を設定
続いて、Theia IDE に CData Connect AI のリモート MCP サーバーを登録して、組み込みの AI エージェントが Connect AI を通じてライブデータツールを検出・呼び出せるようにしましょう。
- Theia IDE をダウンロードしてインストール
- Theia IDE を開き、Settings に移動(または Ctrl + , を押す)して Settings ビューを開きます
-
Settings パネルで AI Features を展開し、MCP を選択
-
Edit in settings.json をクリックして設定ファイルを開き、以下の JSON を貼り付けます:
{ "ai-features.mcp.mcpServers": { "cdata": { "serverUrl": "https://mcp.cloud.cdata.com/mcp", "serverAuthToken": "Basic your_base64_encoded_email_PAT", "serverAuthTokenHeader": "Authorization" } } }注意:Theia IDE は Connect AI への接続に Basic 認証を使用します。Connect AI のユーザーメールアドレスと、先ほど作成した PAT を email:PAT の形式で組み合わせ、Base64 エンコードした文字列の先頭に Basic を付けます。例えば、[email protected]:ABC123...XYZ789 の場合、serverAuthToken の値は Basic dXNlckBkb21haW4uY29tOkFCQzEyMy4uLlhZWjc4OQ== のようになります。
- settings.json ファイルを保存
AI の有効化と LLM プロバイダーの設定
Theia IDE でエージェントの推論を機能させるには、AI 機能を有効化し、少なくとも 1 つの LLM プロバイダーを設定する必要があります。
- Settings に戻り、AI Features から AI Enablement を選択
-
Enable AI のチェックボックスをオンにして、Theia の AI 機能を有効化
- AI Features で、使用する LLM プロバイダー(Anthropic、OpenAI、Google、Hugging Face など)を選択し、API キーを入力
MCP サーバーの登録と LLM プロバイダーの設定が完了しました。これで Theia の AI エージェントが Connect AI を通じてリアルタイムでDatabricks のデータにクエリできるようになりました。
ステップ 3:Theia AI Chat からリアルタイムでDatabricks のデータにクエリ
連携の設定が完了したので、Theia AI Chat パネルからDatabricks のデータを操作してみましょう。
- Theia IDE の右側サイドバーから AI Chat パネルを開きます
- チャットの下部にある Toggle Capabilities Configuration アイコンをクリック(または Ctrl + Shift + . を押下)して Capabilities パネルを開きます
-
Generic Capabilities から MCP を展開し、cdata サーバー(およびエージェントに公開したい特定のツール)にチェックを入れて、Connect AI のツールをエージェントから利用可能にします
-
チャット入力欄に @AppTester と入力し、続けてプロンプトを記述します。例えば:
- cdata mcp のすべてのカタログを一覧表示して
- Databricks の利用可能なスキーマとテーブルを表示して
- Databricks のデータのテーブルから上位 5 件のレコードを取得して
-
エージェントが Connect AI MCP サーバーを呼び出し、Databricks のデータからリアルタイムの結果を返します
これで、Theia IDE が Connect AI MCP サーバーと通信し、リモート MCP を通じてエディタから直接リアルタイムのDatabricks のデータを取得できるようになりました。
CData Connect AI の入手
クラウドアプリケーションから 数百種類の SaaS、ビッグデータ、NoSQL ソースに直接アクセスするには、CData Connect AI をぜひお試しください。 14日間の無償トライアルをダウンロードして、今すぐお試しいただけます。ご不明な点がございましたら、サポートチーム までお気軽にお問い合わせください。