Alteryx Designer で Lakebase のデータの準備、ブレンド、分析(Connect AI)
Alteryx はデータの操作を簡単にするソフトウェアプラットフォームです。CData Connect AI と組み合わせることで、Alteryx はデータ自動化プロセスからLakebase のデータに即座にアクセスできます。この記事では、Connect AI を使用して Lakebase に接続し、Alteryx でLakebase のデータを操作する方法を説明します。
CData Connect AI は Lakebase に接続するための専用 SQL Server インターフェースを提供し、ネイティブ対応データベースへのデータレプリケーションを必要とせずにデータクエリを実行できます。CData Connect AI は最適化されたデータ処理機能を備えており、フィルタや JOIN を含むサポート対象のすべての SQL 操作を効率的に Lakebase へ直接送信します。サーバーサイド処理を活用することで、要求されたLakebase のデータを迅速に取得できます。
Alteryx 用に Lakebase への接続を設定
Alteryx から Lakebase への接続は CData Connect AI を介して行います。Alteryx でLakebase のデータを操作するには、まず Lakebase への接続を作成・設定します。
- Connect AI にログインして「Sources」をクリック、次に「 Add Connection」をクリック
- 接続を追加パネルから「Lakebase」を選択
-
Lakebase に接続するために必要な認証プロパティを入力します。
Databricks Lakebase に接続するには、以下のプロパティを設定します。
- DatabricksInstance: Databricks インスタンスまたはサーバーホスト名を指定します。形式は instance-abcdef12-3456-7890-abcd-abcdef123456.database.cloud.databricks.com です。
- Server: Lakebase データベースをホストするサーバーのホスト名または IP アドレスを指定します。
- Port(オプション): Lakebase データベースをホストするサーバーのポート番号を指定します。デフォルトは 5432 です。
- Database(オプション): Lakebase サーバーへの認証後に接続するデータベースを指定します。デフォルトでは認証ユーザーのデフォルトデータベースに接続します。
OAuth クライアント認証
OAuth クライアント資格情報を使用して認証するには、サービスプリンシパルで OAuth クライアントを構成します。手順の概要は以下のとおりです。
- 新しいサービスプリンシパルを作成・構成する
- サービスプリンシパルに権限を割り当てる
- サービスプリンシパル用の OAuth シークレットを作成する
詳細については、ヘルプドキュメントの「Setting Up OAuthClient Authentication」セクションをご参照ください。
OAuth PKCE 認証
PKCE(Proof Key for Code Exchange)を使用した OAuth code タイプで認証するには、以下のプロパティを設定します。
- AuthScheme: OAuthPKCE を指定します。
- User: 認証ユーザーのユーザー ID を指定します。
詳細については、ヘルプドキュメントをご参照ください。
- 「Save & Test」をクリック
-
Lakebase 接続の追加ページで「Permissions」タブに移動し、ユーザーベースのアクセス許可を設定します。
Personal Access Token の作成
REST API、OData API、または Virtual SQL Server を介して Connect AI に接続する場合、Personal Access Token(PAT)を使用して Connect AI への接続を認証します。アクセスの粒度を維持するために、サービスごとに個別の PAT を作成することをお勧めします。
- Connect AI アプリの右上にある歯車アイコン()をクリックして設定ページを開きます。
- 設定ページで「Access Tokens」セクションに移動し、「 Create PAT」をクリックします。
-
PAT に名前を付けて「Create」をクリックします。
- Personal Access Token は作成時にのみ表示されるため、必ずコピーして安全な場所に保存してください。
接続と PAT が設定できたので、Alteryx からLakebase のデータに接続する準備が整いました。
Alteryx から Lakebase に接続
Alteryx Desktop から CData Connect AI Virtual SQL Server への接続を確立するには、以下のステップに従います。
- Alteryx でアカウントを設定します。
-
新しい「Input Data」ツールをワークフローにドラッグ&ドロップします。
- 「Input Data」ツールを選択した状態で、ナビゲーションパネルの「Set Up a Connection」をクリックします。「Data connections」ダイアログが表示されます。
-
「Data sources」をクリックします。「Microsoft SQL Server」>「Quick connect」を選択します。
- 「Connection Manager」ダイアログで「New」をクリックします。
-
「New Data Source」ダイアログで以下の情報を入力します。
- Data Source Name: Microsoft SQL Server ODBC DSN-less
- Driver: ドロップダウンリストから「ODBC Driver 18 for SQL Server」を選択
- Server: tds.cdata.com,14333
- Database: 接続する CData Connect AI データソースの接続名を入力(例: Lakebase1)
- 「Save」をクリックしてから「Connect Credential」をクリックします。
-
「Connections」で以下を入力します。
- Authentication Method: 「Username and password」を選択
- Credential: 「Create New Credential」を選択
- Credential Name: 資格情報を識別するための名前を入力
- Username: CData Connect AI のユーザー名を入力(CData Connect AI インターフェースの右上に表示されます。例: [email protected])
- Password: Settings ページで生成した PAT を入力
- 「Test Connection」をクリックします。成功したら「Create and link」をクリックします。
- 資格情報を使用して「Connect」します。
-
表示されるウィザードで、クエリするテーブルを「Query Builder box」にドラッグ&ドロップします。クエリに含めるフィールドのチェックボックスをオンにします。可能な場合、フィルタや集計によって生成された複雑なクエリはデータソースにプッシュダウンされ、サポートされていない操作(SQL 関数や JOIN 操作を含む場合があります)はコネクタに組み込まれた CData SQL エンジンによってクライアント側で処理されます。
-
データセットをさらにカスタマイズするには、SQL Editor を開いてクエリを手動で変更し、句、集計、その他の操作を追加して、必要なデータを正確に取得できるようにします。
-
クエリが定義できたら、Alteryx Designer でデータを操作する準備が整いました。
CData Connect AI を入手
SQL Server データベースから直接 300 以上の SaaS、ビッグデータ、NoSQL ソースへのリアルタイムデータアクセスを取得するには、CData Connect AI をお試しください。