Amazon SageMaker Canvas から RDS 経由で SharePoint のリアルタイムデータを活用

Dibyendu Datta
Dibyendu Datta
Lead Technology Evangelist
CData Connect AI を使って Amazon SageMaker Canvas の Amazon RDS コネクタから SharePoint に接続し、リアルタイムのSharePoint のデータでカスタムモデルを構築する方法を解説します。

Amazon SageMaker Canvas は、コードを書かずに予測の生成、データの準備、モデルの構築ができるノーコード機械学習プラットフォームです。CData Connect AI と組み合わせることで、クラウド間でリアルタイムにSharePoint のデータにアクセスし、カスタム機械学習モデルの構築、顧客離反予測、テキスト生成、チャットボット開発など、さまざまな用途に活用できます。この記事では、RDS コネクタを使用して Amazon SageMaker Canvas から Connect AI に接続し、SharePoint のデータを ML モデルのデプロイメントに統合する方法をご紹介します。

CData Connect AI は、SharePoint 向けに純粋な SQL インターフェースをクラウド間で提供します。これにより、データをレプリケーションすることなく、Amazon SageMaker Canvas からSharePoint のデータに簡単に接続できます。Connect AI は Amazon SageMaker Canvas からは SQL Server データベースとまったく同じように見え、フィルタや JOIN などの SQL 操作をSharePointに直接プッシュする最適化されたデータ処理により、サーバーサイド処理を活用してSharePoint のデータをすばやく取得します。

SharePoint データ連携について

CData を使用すれば、SharePoint のライブデータへのアクセスと統合がこれまでになく簡単になります。お客様は CData の接続機能を以下の目的で利用しています:

  • Windows SharePoint Services 3.0、Microsoft Office SharePoint Server 2007 以降、SharePoint Online を含む、幅広い SharePoint バージョンのデータにアクセスできます。
  • 非表示カラムとルックアップカラムのサポートにより、SharePoint のすべてにアクセスできます。
  • フォルダを再帰的にスキャンして、すべての SharePoint データのリレーショナルモデルを作成できます。
  • SQL ストアドプロシージャを使用して、ドキュメントや添付ファイルをアップロード・ダウンロードできます。

多くのお客様は、SharePoint データをデータベースやデータウェアハウスに統合するために CData ソリューションを活用していますが、Power BI、Tableau、Excel などのお気に入りのデータツールと SharePoint データを統合しているお客様もいます。

お客様が CData の SharePoint ソリューションで問題を解決している方法については、ブログをご覧ください:Drivers in Focus: Collaboration Tools


はじめに


SharePoint への接続を設定(Amazon SageMaker Canvas 向け)

Amazon SageMaker Canvas から SharePoint への接続は、CData Connect AI を介して行います。それでは、SharePoint のデータを Amazon SageMaker Canvas から利用できるようにするため、SharePoint への接続を作成していきましょう。

  1. Connect AI にログインして「Sources」をクリック、次に「 Add Connection」をクリック
  2. 接続を追加パネルから「SharePoint」を選択
  3. SharePoint に接続するために必要な認証プロパティを入力します。

    Microsoft SharePoint への接続

    URL の設定:

    Microsoft SharePoint では、2つの範囲でデータを操作できます。グローバルなMicrosoft SharePoint サイト全体を対象にするか、個々のサイトのみを対象にするかを選択できます。

    グローバルなMicrosoft SharePoint サイトですべてのリストおよびドキュメントを操作したい場合は、URL 接続プロパティをサイトコレクションURL に設定しましょう。以下のような形式です。

    https://teams.contoso.com

    個々のサイトのリストおよびドキュメントのみを扱いたい場合は、URL 接続プロパティを個々のサイトURL に設定してください。以下のような形式です。

    https://teams.contoso.com/TeamA

    続いて、お使いの環境に適した認証プロパティを設定していきましょう。詳細な設定手順については、 href="/kb/help/" target="_blank">ヘルプドキュメントの「はじめに」をご参照ください。

    Microsoft SharePoint Online

    SharePointEdition を"SharePoint Online" に設定し、User およびPassword にはSharePoint へのログオンで使用するクレデンシャル(例:Microsoft Online Services アカウントのクレデンシャル)を設定します。

    Microsoft SharePoint Online は様々なクラウドベースアーキテクチャをサポートしており、それぞれ異なる認証スキームが利用できます。

    • Microsoft Entra ID(Azure AD)
    • ADFS、Okta、OneLogin、またはPingFederate SSO ID プロバイダーを介したシングルサインオン(SSO)
    • Azure MSI
    • Azure パスワード
    • OAuthJWT
    • SharePointOAuth

    Microsoft SharePoint オンプレミス

    Microsoft SharePoint オンプレミスでは、多くのオンプレミス環境に対応した認証方式をサポートしています。

    • Windows(NTLM)
    • Kerberos
    • ADFS
    • 匿名アクセス

    まずSharePointEdition を"SharePoint On-Premises" に設定しましょう。

    Windows(NTLM)認証

    これは最も一般的な認証方式です。そのため、CData 製品ではNTLM をデフォルトとして使用するよう事前設定されています。Windows のUser およびPassword を設定するだけで接続できます。

  4. 「Save & Test」をクリック
  5. SharePoint 接続の追加ページで「Permissions」タブに移動し、ユーザーベースの権限を更新します。

パーソナルアクセストークンを追加

REST API、OData API、または仮想 SQL Server を通じて Connect AI に接続する場合は、パーソナルアクセストークン(PAT)を使用して認証を行います。アクセス管理を細かく制御するため、サービスごとに個別の PAT を作成することをお勧めします。

  1. Connect AI アプリの右上にある歯車アイコン()をクリックして設定ページを開きます。
  2. 設定ページで「Access Tokens」セクションに移動し、「 Create PAT」をクリックします。
  3. PAT に名前を付けて「Create」をクリックします。
  4. パーソナルアクセストークンは作成時にのみ表示されます。必ずコピーして、今後の利用のために安全に保管してください。

接続の設定と PAT の生成が完了したら、Amazon SageMaker Canvas からSharePoint のデータに接続する準備は完了です。

Amazon SageMaker Canvas から CData Connect AI に接続

CData Connect AI での接続設定が完了したら、RDS コネクタを使用してSharePoint のデータを Amazon SageMaker Canvas に統合していきましょう。

  1. Amazon SageMaker Canvas でドメインとユーザープロファイルを選択し、「Open Canvas」をクリックします。
  2. Canvas アプリケーションが開いたら、左側のパネルに移動して「My models」を選択します。
  3. My models 画面で「Create new model」をクリックします。
  4. Create new model ウィンドウでモデル名を入力し、Problem type を選択します。「Create」をクリックします。
  5. モデルバージョンが作成されたら、Select dataset タブで「Create dataset」をクリックします。
  6. Create a tabular dataset ウィンドウで「Dataset name」を入力し、「Create」をクリックします。
  7. 「Data Source」ドロップダウンをクリックして RDS コネクタを検索またはナビゲートし、「 Add Connection」をクリックします。
  8. Add a new RDS connection ウィンドウで、以下のプロパティを設定します。

    • Connection Name: 任意の接続名
    • Engine type を sqlserver-web に設定
    • Port を 14333 に設定
    • Addresstds.cdata.com に設定
    • Username を Connect AI ユーザー(例: [email protected])に設定
    • Password を上記ユーザーの PAT に設定
    • Database name を SharePoint 接続名(例: SharePoint1)に設定
  9. 「Create connection」をクリックします。

SharePoint を Amazon SageMaker Canvas に統合

RDS で Connect AI への接続が設定できたら、SharePoint のデータを Amazon SageMaker Canvas のデータセットに統合していきましょう。

  1. SharePoint のデータで作成した RDS のテーブル形式データセットで、検索バーまたは接続リストから Connect AI で設定した SharePoint 接続を検索します。
  2. SharePoint から使用したいテーブルを選択し、右側のキャンバスにドラッグ&ドロップします。
  3. 以下のように、SharePoint 接続から任意の数のテーブルを結合してワークフローを作成できます。「Create dataset」をクリックします。
  4. データセットが作成されたら、「Select dataset」をクリックしてモデルを構築します。
  5. 分析を実行し、予測を生成してモデルをデプロイします。

これで、Amazon SageMaker からSharePoint のデータにリアルタイムでアクセスできるようになりました。カスタム ML モデルを構築し、ビジネスの予測インサイトを生成して、組織の成長に活用してください。

クラウドアプリケーションから SharePoint への SQL アクセス

Amazon SageMaker Canvas からSharePoint のデータへのダイレクト接続が完成しました。データをレプリケーションすることなく、接続やデータセット、予測モデルをさらに追加してビジネスを推進できます。

300 以上の SaaS、ビッグデータ、NoSQL ソースにクラウドアプリケーションから直接リアルタイムアクセスするには、CData Connect AI をご覧ください。

はじめる準備はできましたか?

CData Connect AI の詳細、または無料トライアルにお申し込みください:

無料トライアル お問い合わせ