CData Connect AI を使って Windsurf IDE からリアルタイム Databricks データにアクセス

Yazhini G
Yazhini G
Technical Marketing Engineer
CData Connect AI のリモート MCP サーバーを活用して、Windsurf の Cascade エージェントが IDE 内からセキュアにDatabricksのリアルタイムデータにアクセスし、クエリを実行できるようにします。

Windsurf は、プロジェクトのコンテキストを理解し、エディタ内で複雑なタスクを自律的に実行するコーディングエージェント Cascade を中心に設計された AI ネイティブ IDE です。Cascade は MCP(Model Context Protocol) をサポートしており、エージェントが開発環境から離れることなく外部ツールやデータソースを検出し、呼び出すことができます。

Windsurf を CData Connect AI の組み込み MCP サーバー と連携することで、Cascade エージェントはガバナンスの効いたリアルタイムDatabricks のデータに IDE 内からアクセスできるようになります。これにより、開発者は自然言語プロンプトを使って、Windsurf から直接カタログの一覧表示、スキーマの確認、Databricks のデータレコードのクエリが行えます。

この記事では、Connect AI での Databricks 接続の設定、必要な Personal Access Token の生成、Windsurf への Connect AI MCP Server の設定、そして Cascade チャットからリアルタイムDatabricks のデータをクエリして連携を確認する方法について説明します。

Databricks データ連携について

CData を使用すれば、Databricks のライブデータへのアクセスと統合がこれまでになく簡単になります。お客様は CData の接続機能を以下の目的で利用しています:

  • Runtime バージョン 9.1 - 13.X から Pro および Classic Databricks SQL バージョンまで、すべてのバージョンの Databricks にアクセスできます。
  • あらゆるホスティングソリューションとの互換性により、お好みの環境で Databricks を使用し続けることができます。
  • パーソナルアクセストークン、Azure サービスプリンシパル、Azure AD など、さまざまな方法で安全に認証できます。
  • Databricks ファイルシステム、Azure Blob ストレージ、AWS S3 ストレージを使用して Databricks にデータをアップロードできます。

多くのお客様が、さまざまなシステムから Databricks データレイクハウスにデータを移行するために CData のソリューションを使用していますが、ライブ接続ソリューションを使用して、データベースと Databricks 間の接続をフェデレートしているお客様も多数います。これらのお客様は、SQL Server リンクサーバーまたは Polybase を使用して、既存の RDBMS 内から Databricks へのライブアクセスを実現しています。

一般的な Databricks のユースケースと CData のソリューションがデータの問題解決にどのように役立つかについては、ブログをご覧ください:What is Databricks Used For? 6 Use Cases


はじめに


ステップ 1:Windsurf 用の Databricks 接続を設定

Windsurf から Databricks への接続は、CData Connect AI のリモート MCP サーバーによって実現されます。Windsurf からDatabricks のデータを操作するには、まず CData Connect AI で Databricks 接続を作成・設定します。

  1. Connect AI にログインし、Sources をクリック、次に Add Connection をクリック
  2. Add Connection パネルから Databricks を選択
  3. Databricks に接続するために必要な認証プロパティを入力します。

    Databricks 接続プロパティの取得・設定方法

    Databricks クラスターに接続するには、以下のプロパティを設定します。

    • Database:Databricks データベース名。
    • Server:Databricks クラスターのサーバーのホスト名
    • HTTPPath:Databricks クラスターのHTTP パス。
    • Token:個人用アクセストークン。この値は、Databricks インスタンスのユーザー設定ページに移動してアクセストークンタブを選択することで取得できます。
    Databricks インスタンスで必要な値は、クラスターに移動して目的のクラスターを選択し、Advanced Options の下にあるJDBC/ODBC タブを選択することで見つけることができます。

    Databricks への認証

    CData は、次の認証スキームをサポートしています。

    • 個人用アクセストークン
    • Microsoft Entra ID(Azure AD)
    • Azure サービスプリンシパル
    • OAuthU2M
    • OAuthM2M

    個人用アクセストークン

    認証するには、次を設定します。

    • AuthSchemePersonalAccessToken
    • Token:Databricks サーバーへの接続に使用するトークン。Databricks インスタンスのユーザー設定ページに移動してアクセストークンタブを選択することで取得できます。

    その他の認証方法については、ヘルプドキュメント の「はじめに」セクションを参照してください。

  4. Save & Test をクリック
  5. Permissions タブに移動し、ユーザーベースの権限を更新

Personal Access Token を追加

Personal Access Token(PAT)は、Windsurf から Connect AI への接続を認証するために使用されます。きめ細かいアクセス制御を維持するため、連携ごとに個別の PAT を作成することをお勧めします。

  1. Connect AI アプリの右上にある歯車アイコン()をクリックして Settings を開く
  2. Settings ページで Access Tokens セクションに移動し、 Create PAT をクリック
  3. PAT にわかりやすい名前を付けて Create をクリック
  4. Personal Access Token は作成時にのみ表示されるので、必ずコピーして安全な場所に保存してください

Databricks 接続の設定と PAT の生成が完了したら、Windsurf から Connect AI 経由でDatabricks のデータに接続できます。

ステップ 2:Windsurf で Connect AI MCP を設定

次に、Cascade エージェントが Connect AI を通じてリアルタイムデータツールを検出・呼び出せるよう、Windsurf に Connect AI リモート MCP サーバーを設定します。

  1. Windsurf IDE をダウンロードしてインストール
  2. Windsurf を開き、右上のプロフィールアイコンをクリックして Windsurf Settings を選択
  3. Cascade セクションで MCP Servers を見つけ、Open MCP Registry をクリック
  4. MCP Marketplace で右上の Add custom MCP をクリック
  5. この操作で mcp_config.json ファイルが開きます。以下の JSON を貼り付けてください:
    {
        "mcpServers": {
            "cdata-mcp": {
                "serverUrl": "https://mcp.cloud.cdata.com/mcp",
                "headers": {
                    "Authorization": "Basic your_base64_encoded_email_PAT",
                    "Content-Type": "application/json"
                }
            }
        }
    }
    		

    注意:Windsurf は Connect AI に対して Basic 認証を使用します。Connect AI のユーザーメールアドレスと先ほど作成した PAT を email:PAT の形式で連結し、その文字列を Base64 エンコードして Basic を先頭に付けてください。例えば [email protected]:ABC123...XYZ789 の場合、Authorization ヘッダーの値は Basic dXNlckBkb21haW4uY29tOkFCQzEyMy4uLlhZWjc4OQ== のようになります。

  6. mcp_config.json ファイルを保存し、MCP Registry に戻る
  7. Installed の下に cdata-mcp が表示され、Enabled とマークされていることを確認

MCP サーバーの登録と有効化が完了したら、Windsurf から Connect AI を通じてリアルタイムのDatabricks のデータをクエリする準備が整いました。

ステップ 3:Windsurf からリアルタイムのDatabricks のデータをクエリ

連携が完了したら、Windsurf の Cascade チャットパネルを使って自然言語プロンプトでリアルタイムのDatabricks のデータを操作できます。

  1. Windsurf の上部バーで Editor から Agent に切り替えて新しい Cascade チャットを開く
  2. チャットパネルの下部で cdata-mcp サーバーが表示され、トグルが有効になっていることを確認
  3. 以下のようなプロンプトを入力してエージェントとのやり取りを開始:
    • cdata-mcp 接続内のすべてのカタログを一覧表示して
    • Databricks で利用可能なスキーマとテーブルを表示して
    • Databricks のデータ のテーブルからトップ 5 件のレコードをクエリして
  4. Cascade エージェントが Connect AI MCP Server を呼び出し、リアルタイムのDatabricks のデータを返します

これで、Windsurf IDE が Connect AI MCP Server と通信し、エディタから直接リモート MCP を通じてリアルタイムのDatabricks のデータを取得できるようになりました。

CData Connect AI を入手

数百種類の SaaS、ビッグデータ、NoSQL データソースに開発ツールから直接アクセスするには、CData Connect AI をお試しください!

はじめる準備はできましたか?

CData Connect AI の詳細、または無料トライアルにお申し込みください:

無料トライアル