SQL Server 2025 と CData Sync で AI ワークフローを強化

Microsoft は、SQL Server 2025 のリリースにより、旗艦データベースをエンタープライズ AI ワークフローの中核プラットフォームとして位置付けました。ネイティブベクトルサポートが追加されたことで、SQL Server を使用している企業は、エンベディングを SQL Server 内で直接保存、検索、分析できるようになりました。AI ワークロードに外部のベクトルデータベースを使用する必要がなくなったのです。

AI ネイティブ機能を SQL レイヤーに組み込むことで、Microsoft は複雑さを排除し、セマンティック検索、レコメンデーションエンジン、検索拡張生成（RAG）パイプラインなどの AI 駆動型アプリケーションの構築を可能にしました。この記事では、SQL Server 2025 に含まれる新しい AI 機能を詳しく見ていき、これらの機能が重要な理由を理解し、CData Sync と SQL Server 2025 を使用して AI ワークフローを構築するためのステップバイステップガイドをご紹介します。

SQL Server 2025 の新機能

まだプレビューリリースの段階ですが、SQL Server 2025 は一連の組み込み AI 機能をサポートするようになりました。

Vector データ型：類似検索や機械学習アプリケーションなどの操作で JSON 配列として公開される、最適化されたバイナリ形式でベクトルデータを保存できます。
AI 関数：
- AI_GENERATE_EMBEDDINGS：テキスト式からエンベディング（ベクトル配列）を生成します。
- AI_GENERATE_CHUNKS：サイズとオーバーラップのパラメータに基づいて、テキスト式からテキストのチャンクを作成します。
Vector 関数：
- VECTOR_DISTANCE：指定された距離メトリクスを使用して、2 つのベクトル間の距離を計算します。
- VECTOR_SEARCH：近似ベクトル検索アルゴリズムを使用して、指定されたクエリベクトルと距離メトリクスに最も近いベクトルを返します。
- VECTOR_NORM：ベクトルを入力として受け取り、指定されたノルムタイプでベクトルのノルム（長さまたは大きさを表す尺度）を返します。
- VECTOR_NORMALIZE：指定されたノルムタイプのルールに従って、ベクトルの長さが正規化されるようにベクトルを調整します。
近似最近傍（ANN）インデックス：最小限の精度を犠牲にしてはるかに高速なパフォーマンスを実現し、クエリに最も近いベクトルを素早く返すことで類似検索を高速化します。

実際のユースケース

ユースケース	ベクトル機能の価値	本番環境での利点
セマンティック検索 / ナレッジ検索	「このリクエストに類似した記事を検索する」など、クエリ結果から関連性の高い、または類似した一致を見つける機能です。	サポートや営業の質問への応答が高速化され、関連性が向上し、手動でのキーワードタグ付けが削減されます。
検索拡張生成（RAG）	エンベディングを使用して LLM にコンテキスト（会社のドキュメント、CRM データなど）を取得させ、生成される回答が企業独自のデータとリソースを活用したものになるようにします。	精度が向上し、ハルシネーションが減少することで、AI エージェントへの信頼性が高まります。
異常検知 / セマンティッククラスタリング	ログ、イベント、説明文のエンベディングにより、セマンティッククラスタリングが可能になり、予想されるパターンから逸脱する項目を特定できます。	セキュリティや不正検知、サポートチケットやエンジニアリングのバグ追跡に非常に有用です。

ガイド：CData Sync と SQL Server 2025 のセットアップ

このガイドでは Jira データへの接続を例に説明していますが、同じ手順を CData Sync がサポートする 250 以上のデータソースすべてに適用できます。

ステップ 1：CData Sync でレプリケーションジョブを設定する

CData Sync で SQL Server をレプリケーション先として構成します。
対象のデータソース接続（この例では Jira）を構成します。
データソース（この例では Jira）から SQL Server 2025 にデータをレプリケートするレプリケーションジョブを作成します。
ジョブを実行して、データを SQL Server 2025 にレプリケートします。

この時点で、Jira データが SQL Server 2025 にレプリケートされているはずです。この例では、Key、Summary、Description など、エンベディング生成の良い例となるフィールドを含む Jira の Issues テーブルをレプリケートしています。

ステップ 2：エンベディングテーブルを作成する

PREVIEW_FEATURES を ON に設定します：

ALTER DATABASE SCOPED CONFIGURATION SET PREVIEW_FEATURES = ON;
GO

データベースで外部 REST エンドポイント呼び出しを ON にします：

EXECUTE sp_configure 'external rest endpoint enabled', 1;
    RECONFIGURE WITH OVERRIDE;
GO

データベースのマスターキーを作成します

CREATE MASTER KEY ENCRYPTION BY PASSWORD = YourSecurePassword;

Jira Issue エンベディング用の新しいテーブルを作成します：

CREATE TABLE [IssuesEmbeddings] (
    IssueKey NVARCHAR(50) PRIMARY KEY,
    CombinedText NVARCHAR(MAX),
    IssueEmbedding VECTOR(1536)
    );

ステップ 3：エンベディングを生成する

前提条件：エンベディングコマンドを実行する前に、選択したエンベディングサービスの API 資格情報で SQL Server 2025 を構成する必要があります。以下の例では、エンベディングサービスに Azure OpenAI API を使用しています。

エンベディングプロバイダー API 用のデータベーススコープ資格情報を作成します：

CREATE DATABASE SCOPED CREDENTIAL [https://my-azure-openai-endpoint.openai.azure.com/]
    WITH IDENTITY = 'HTTPEndpointHeaders', secret = '{"api-key":"YOUR_AZURE_OPENAI_KEY"}';
GO

エンベディングプロバイダー API を呼び出すための外部モデルを作成します：

CREATE EXTERNAL MODEL MyAzureOpenAiModel
WITH (
      LOCATION = 'https://my-azure-openai-endpoint.openai.azure.com/openai/deployments/text-embedding-ada-002/embeddings?api-version=2023-05-15',
      API_FORMAT = 'Azure OpenAI',
      MODEL_TYPE = EMBEDDINGS,
      MODEL = 'text-embedding-ada-002',
      CREDENTIAL = [https://my-azure-openai-endpoint.openai.azure.com/]
);

AI_GENERATE_EMBEDDINGS 関数を使用してエンベディングを生成し、IssuesEmbeddings テーブルの IssueEmbedding カラムにデータを入力します：

INSERT INTO [IssuesEmbeddings] (IssueKey, CombinedText, IssueEmbedding)
SELECT
    [Key],
    CONCAT(Summary, '. ', ISNULL(Description, '')) AS CombinedText,
    AI_GENERATE_EMBEDDINGS ( CONCAT(Summary, '. ', ISNULL(Description, '')) USE MODEL GoogleEmbeddingModel )
FROM [Issues]
WHERE Summary IS NOT NULL;

これで、CData Sync を通じて Jira からレプリケートしたデータを使用して、SQL Server 2025 にエンベディングテーブルを作成できました。SQL Server のネイティブベクトル機能を活用して、SQL Server 環境内で直接、類似検索、クラスタリング、その他の AI 駆動型分析を実行できます。

SQL Server 2025 で今すぐ AI ワークフローを実現

SQL Server 2025 のベクトルサポートは AI ワークフローにとって大きなアップグレードですが、真のパワーはエンタープライズデータが方程式に加わったときに発揮されます。CData Sync は、SaaS、ERP、データベースソースを SQL Server 2025 に直接接続し、本番対応の AI ユースケース向けに構築された高速、安全、自動化されたデータレプリケーションを提供します。

CData Sync を使用して統合された、新鮮でコンテキストに沿ったデータで、セマンティック検索、RAG パイプライン、エンタープライズコパイロットを強化しましょう。詳細情報の確認と無料トライアルのダウンロードは、CData Sync 製品ページをご覧ください。ご不明な点がございましたら、サポートチームがお答えします。