Alteryx Designer で Snowflake のデータの準備、ブレンド、分析(Connect AI)
Alteryx はデータの操作を簡単にするソフトウェアプラットフォームです。CData Connect AI と組み合わせることで、Alteryx はデータ自動化プロセスからSnowflake のデータに即座にアクセスできます。この記事では、Connect AI を使用して Snowflake に接続し、Alteryx でSnowflake のデータを操作する方法を説明します。
CData Connect AI は Snowflake に接続するための専用 SQL Server インターフェースを提供し、ネイティブ対応データベースへのデータレプリケーションを必要とせずにデータクエリを実行できます。CData Connect AI は最適化されたデータ処理機能を備えており、フィルタや JOIN を含むサポート対象のすべての SQL 操作を効率的に Snowflake へ直接送信します。サーバーサイド処理を活用することで、要求されたSnowflake のデータを迅速に取得できます。
Snowflake データ連携について
CData は、Snowflake のライブデータへのアクセスと統合を簡素化します。お客様は CData の接続機能を以下の目的で活用しています:
- Snowflake データを迅速かつ効率的に読み書きできます。
- 指定された Warehouse、Database、Schema のメタデータを動的に取得できます。
- OAuth、OKTA、Azure AD、Azure マネージド サービス ID、PingFederate、秘密鍵など、さまざまな方法で認証できます。
多くの CData ユーザーは、CData ソリューションを使用して、お気に入りのツールやアプリケーションから Snowflake にアクセスし、さまざまなシステムからデータを Snowflake にレプリケートして、包括的なウェアハウジングと分析を行っています。
CData ソリューションとの Snowflake 統合についての詳細は、ブログをご覧ください:https://jp.cdata.com/blog/snowflake-integrations
はじめに
Alteryx 用に Snowflake への接続を設定
Alteryx から Snowflake への接続は CData Connect AI を介して行います。Alteryx でSnowflake のデータを操作するには、まず Snowflake への接続を作成・設定します。
- Connect AI にログインして「Sources」をクリック、次に「 Add Connection」をクリック
- 接続を追加パネルから「Snowflake」を選択
-
Snowflake に接続するために必要な認証プロパティを入力します。
それでは、Snowflake データベースに接続していきましょう。認証に加えて、以下の接続プロパティを設定します。
- Url:お使いのSnowflake URL を指定します。例:https://orgname-myaccount.snowflakecomputing.com
- Legacy URL を使用する場合:https://myaccount.region.snowflakecomputing.com
- ご自身のURL は以下のステップで確認できます。
- Snowflake UI の左下にあるユーザー名をクリックします
- Account ID にカーソルを合わせます
- Copy Account URL アイコンをクリックして、アカウントURL をコピーします
- Database(オプション):CData 製品によって公開されるテーブルとビューを、特定のSnowflake データベースのものに制限したい場合に設定します
- Schema(オプション):CData 製品によって公開されるテーブルとビューを、特定のSnowflake データベーススキーマのものに制限したい場合に設定します
Snowflakeへの認証
CData 製品では、Snowflake ユーザー認証、フェデレーション認証、およびSSL クライアント認証をサポートしています。認証するには、User とPassword を設定し、AuthScheme プロパティで認証方法を選択してください。
キーペア認証
ユーザーアカウントに定義されたプライベートキーを使用してセキュアなトークンを作成し、キーペア認証で接続することも可能です。この方法で接続するには、AuthScheme をPRIVATEKEY に設定し、以下の値を設定してください。
- User:認証に使用するユーザーアカウント
- PrivateKey:プライベートキーを含む.pem ファイルへのパスなど、ユーザーに使用されるプライベートキー
- PrivateKeyType:プライベートキーを含むキーストアの種類(PEMKEY_FILE、PFXFILE など)
- PrivateKeyPassword:指定されたプライベートキーのパスワード
その他の認証方法については、ヘルプドキュメントの「Snowflakeへの認証」セクションをご確認ください。
- Url:お使いのSnowflake URL を指定します。例:https://orgname-myaccount.snowflakecomputing.com
- 「Save & Test」をクリック
-
Snowflake 接続の追加ページで「Permissions」タブに移動し、ユーザーベースのアクセス許可を設定します。
Personal Access Token の作成
REST API、OData API、または Virtual SQL Server を介して Connect AI に接続する場合、Personal Access Token(PAT)を使用して Connect AI への接続を認証します。アクセスの粒度を維持するために、サービスごとに個別の PAT を作成することをお勧めします。
- Connect AI アプリの右上にある歯車アイコン()をクリックして設定ページを開きます。
- 設定ページで「Access Tokens」セクションに移動し、「 Create PAT」をクリックします。
-
PAT に名前を付けて「Create」をクリックします。
- Personal Access Token は作成時にのみ表示されるため、必ずコピーして安全な場所に保存してください。
接続と PAT が設定できたので、Alteryx からSnowflake のデータに接続する準備が整いました。
Alteryx から Snowflake に接続
Alteryx Desktop から CData Connect AI Virtual SQL Server への接続を確立するには、以下のステップに従います。
- Alteryx でアカウントを設定します。
-
新しい「Input Data」ツールをワークフローにドラッグ&ドロップします。
- 「Input Data」ツールを選択した状態で、ナビゲーションパネルの「Set Up a Connection」をクリックします。「Data connections」ダイアログが表示されます。
-
「Data sources」をクリックします。「Microsoft SQL Server」>「Quick connect」を選択します。
- 「Connection Manager」ダイアログで「New」をクリックします。
-
「New Data Source」ダイアログで以下の情報を入力します。
- Data Source Name: Microsoft SQL Server ODBC DSN-less
- Driver: ドロップダウンリストから「ODBC Driver 18 for SQL Server」を選択
- Server: tds.cdata.com,14333
- Database: 接続する CData Connect AI データソースの接続名を入力(例: Snowflake1)
- 「Save」をクリックしてから「Connect Credential」をクリックします。
-
「Connections」で以下を入力します。
- Authentication Method: 「Username and password」を選択
- Credential: 「Create New Credential」を選択
- Credential Name: 資格情報を識別するための名前を入力
- Username: CData Connect AI のユーザー名を入力(CData Connect AI インターフェースの右上に表示されます。例: [email protected])
- Password: Settings ページで生成した PAT を入力
- 「Test Connection」をクリックします。成功したら「Create and link」をクリックします。
- 資格情報を使用して「Connect」します。
-
表示されるウィザードで、クエリするテーブルを「Query Builder box」にドラッグ&ドロップします。クエリに含めるフィールドのチェックボックスをオンにします。可能な場合、フィルタや集計によって生成された複雑なクエリはデータソースにプッシュダウンされ、サポートされていない操作(SQL 関数や JOIN 操作を含む場合があります)はコネクタに組み込まれた CData SQL エンジンによってクライアント側で処理されます。
-
データセットをさらにカスタマイズするには、SQL Editor を開いてクエリを手動で変更し、句、集計、その他の操作を追加して、必要なデータを正確に取得できるようにします。
-
クエリが定義できたら、Alteryx Designer でデータを操作する準備が整いました。
CData Connect AI を入手
SQL Server データベースから直接 300 以上の SaaS、ビッグデータ、NoSQL ソースへのリアルタイムデータアクセスを取得するには、CData Connect AI をお試しください。