Airbyte ELT パイプラインで SharePoint のデータに接続
Airbyte は、データウェアハウス、データレイク、データベースなど、あらゆるデータストアにデータをロードできる強力なツールです。CData Connect AI と組み合わせることで、Airbyte ユーザーはリアルタイムの SharePoint のデータ から直接 Extract, Load, Transform(ELT)パイプラインを作成できます。本記事では、Connect AI を通じて SharePoint に接続し、Airbyte 内で SharePoint のデータ の ELT パイプラインを構築する手順を説明します。
CData Connect AI は SharePoint 専用の SQL Server インターフェースを提供し、ネイティブデータベースへのデータレプリケーションを行うことなくデータをクエリできます。最適化されたデータ処理機能を内蔵しており、フィルタや JOIN を含むサポート対象のすべての SQL 操作を SharePoint に直接転送します。これにより、サーバーサイド処理を活用して目的の SharePoint のデータ を高速に取得できます。
SharePoint データ連携について
CData を使用すれば、SharePoint のライブデータへのアクセスと統合がこれまでになく簡単になります。お客様は CData の接続機能を以下の目的で利用しています:
- Windows SharePoint Services 3.0、Microsoft Office SharePoint Server 2007 以降、SharePoint Online を含む、幅広い SharePoint バージョンのデータにアクセスできます。
- 非表示カラムとルックアップカラムのサポートにより、SharePoint のすべてにアクセスできます。
- フォルダを再帰的にスキャンして、すべての SharePoint データのリレーショナルモデルを作成できます。
- SQL ストアドプロシージャを使用して、ドキュメントや添付ファイルをアップロード・ダウンロードできます。
多くのお客様は、SharePoint データをデータベースやデータウェアハウスに統合するために CData ソリューションを活用していますが、Power BI、Tableau、Excel などのお気に入りのデータツールと SharePoint データを統合しているお客様もいます。
お客様が CData の SharePoint ソリューションで問題を解決している方法については、ブログをご覧ください:Drivers in Focus: Collaboration Tools
はじめに
Airbyte 用に SharePoint への接続を構成
Airbyte から SharePoint への接続は、CData Connect AI を介して実現します。Airbyte で SharePoint のデータ を利用するには、まず SharePoint 接続を作成・設定します。
- Connect AI にログインし、Sources をクリックして、 Add Connection をクリックします
- Add Connection パネルから「SharePoint」を選択します
-
SharePoint に接続するために必要な認証プロパティを入力します。
Microsoft SharePoint への接続
URL の設定:
Microsoft SharePoint では、2つの範囲でデータを操作できます。グローバルなMicrosoft SharePoint サイト全体を対象にするか、個々のサイトのみを対象にするかを選択できます。
グローバルなMicrosoft SharePoint サイトですべてのリストおよびドキュメントを操作したい場合は、URL 接続プロパティをサイトコレクションURL に設定しましょう。以下のような形式です。
https://teams.contoso.com
個々のサイトのリストおよびドキュメントのみを扱いたい場合は、URL 接続プロパティを個々のサイトURL に設定してください。以下のような形式です。
https://teams.contoso.com/TeamA
続いて、お使いの環境に適した認証プロパティを設定していきましょう。詳細な設定手順については、 href="/kb/help/" target="_blank">ヘルプドキュメントの「はじめに」をご参照ください。
Microsoft SharePoint Online
SharePointEdition を"SharePoint Online" に設定し、User およびPassword にはSharePoint へのログオンで使用するクレデンシャル(例:Microsoft Online Services アカウントのクレデンシャル)を設定します。
Microsoft SharePoint Online は様々なクラウドベースアーキテクチャをサポートしており、それぞれ異なる認証スキームが利用できます。
- Microsoft Entra ID(Azure AD)
- ADFS、Okta、OneLogin、またはPingFederate SSO ID プロバイダーを介したシングルサインオン(SSO)
- Azure MSI
- Azure パスワード
- OAuthJWT
- SharePointOAuth
Microsoft SharePoint オンプレミス
Microsoft SharePoint オンプレミスでは、多くのオンプレミス環境に対応した認証方式をサポートしています。
- Windows(NTLM)
- Kerberos
- ADFS
- 匿名アクセス
まずSharePointEdition を"SharePoint On-Premises" に設定しましょう。
Windows(NTLM)認証
これは最も一般的な認証方式です。そのため、CData 製品ではNTLM をデフォルトとして使用するよう事前設定されています。Windows のUser およびPassword を設定するだけで接続できます。
- Save & Test をクリックします
-
Add SharePoint Connection ページの Permissions タブに移動し、ユーザーベースの権限を更新します。
パーソナルアクセストークンの追加
REST API、OData API、または仮想 SQL Server を介して Connect AI に接続する際、パーソナルアクセストークン(PAT)を使用して Connect AI への接続を認証します。アクセスの粒度を維持するために、サービスごとに個別の PAT を作成することをお勧めします。
- Connect AI アプリの右上にある歯車アイコン()をクリックして設定ページを開きます。
- Settings ページで Access Tokens セクションに移動し、 Create PAT をクリックします。
-
PAT に名前を付けて Create をクリックします。
- パーソナルアクセストークンは作成時にのみ表示されます。必ずコピーして、将来の使用に備えて安全な場所に保存してください。
接続の設定と PAT の生成が完了したら、Airbyte から SharePoint のデータ に接続する準備が整いました。
Airbyte から SharePoint に接続
Airbyte から CData Connect AI への接続を確立するには、以下の手順に従います。
- Airbyte アカウントにログインします
- 左側のパネルで Sources をクリックし、Add New Source をクリックします
- Source Type を MSSQL Server に設定して TDS エンドポイントに接続します
- Source Name を設定します
- Host URL を tds.cdata.com に設定します
- Port を 14333 に設定します
- Database を事前に設定した接続名(例:SharePoint1)に設定します
- Username を Connect AI のユーザー名に設定します
- SSL Method を Encrypted (trust server certificate) に設定し、Replication Method は標準のまま、SSH Tunnel Method を No Tunnel に設定します
- (オプション)Schema にソースに適用したい値を設定します
- Password を Connect AI の PAT に設定します
- (オプション)必要な JDBC URL パラメータを入力します
- Test and Save をクリックしてデータソースを作成します。
SharePoint のデータ用の ELT パイプラインを作成
SharePoint のデータ を新しい同期先に接続するには、Sources をクリックし、Set Up Connection をクリックして同期先に接続します。上記で作成したソースと目的の同期先を選択し、Airbyte の処理が完了するまで待ちます。完了すると、接続が使用可能になります。
CData Connect AI の入手
Airbyte から 300 以上の SaaS、ビッグデータ、NoSQL ソースへのリアルタイムデータアクセスを実現するには、 CData Connect AI をぜひお試しください!