Alteryx Designer で Elasticsearch のデータの準備、ブレンド、分析(Connect AI)
Alteryx はデータの操作を簡単にするソフトウェアプラットフォームです。CData Connect AI と組み合わせることで、Alteryx はデータ自動化プロセスからElasticsearch のデータに即座にアクセスできます。この記事では、Connect AI を使用して Elasticsearch に接続し、Alteryx でElasticsearch のデータを操作する方法を説明します。
CData Connect AI は Elasticsearch に接続するための専用 SQL Server インターフェースを提供し、ネイティブ対応データベースへのデータレプリケーションを必要とせずにデータクエリを実行できます。CData Connect AI は最適化されたデータ処理機能を備えており、フィルタや JOIN を含むサポート対象のすべての SQL 操作を効率的に Elasticsearch へ直接送信します。サーバーサイド処理を活用することで、要求されたElasticsearch のデータを迅速に取得できます。
Elasticsearch データ連携について
CData を使用すれば、Elasticsearch のライブデータへのアクセスと統合がこれまでになく簡単になります。お客様は CData の接続機能を以下の目的で利用しています:
- SQL エンドポイントと REST エンドポイントの両方にアクセスでき、接続を最適化し、Elasticsearch データの読み書きに関してより多くのオプションを提供します。
- v2.2 以降およびオープンソース Elasticsearch サブスクリプションを含む、ほぼすべての Elasticsearch インスタンスに接続できます。
- SCORE() 関数を明示的に要求することなく、常にクエリ結果の関連性スコアを受け取ることができます。これにより、サードパーティツールからのアクセスが簡素化され、クエリ結果のテキスト関連性のランキングを簡単に確認できます。
- 複数のインデックスを検索でき、クライアントマシンではなく Elasticsearch がクエリと結果の管理・処理を担当します。
ユーザーは、Crystal Reports、Power BI、Excel などの分析ツールと Elasticsearch データを統合し、当社のツールを活用して、Elasticsearch を含むすべてのデータソースへの単一のフェデレートアクセスレイヤーを実現しています。
CData の Elasticsearch ソリューションの詳細については、ナレッジベース記事をご覧ください:CData Elasticsearch Driver Features & Differentiators
はじめに
Alteryx 用に Elasticsearch への接続を設定
Alteryx から Elasticsearch への接続は CData Connect AI を介して行います。Alteryx でElasticsearch のデータを操作するには、まず Elasticsearch への接続を作成・設定します。
- Connect AI にログインして「Sources」をクリック、次に「 Add Connection」をクリック
- 接続を追加パネルから「Elasticsearch」を選択
-
Elasticsearch に接続するために必要な認証プロパティを入力します。
Elasticsearch 接続プロパティの取得・設定方法
接続するには、Server およびPort 接続プロパティを設定します。 認証には、User とPassword プロパティ、PKI (public key infrastructure)、またはその両方を設定します。 PKI を使用するには、SSLClientCert、SSLClientCertType、SSLClientCertSubject、およびSSLClientCertPassword プロパティを設定します。
CData 製品は、認証とTLS/SSL 暗号化にX-Pack Security を使用しています。TLS/SSL で接続するには、Server 値に'https://' を接頭します。Note: PKI を 使用するためには、TLS/SSL およびクライアント認証はX-Pack 上で有効化されていなければなりません。
接続されると、X-Pack では、設定したリルムをベースにユーザー認証およびロールの許可が実施されます。
- 「Save & Test」をクリック
-
Elasticsearch 接続の追加ページで「Permissions」タブに移動し、ユーザーベースのアクセス許可を設定します。
Personal Access Token の作成
REST API、OData API、または Virtual SQL Server を介して Connect AI に接続する場合、Personal Access Token(PAT)を使用して Connect AI への接続を認証します。アクセスの粒度を維持するために、サービスごとに個別の PAT を作成することをお勧めします。
- Connect AI アプリの右上にある歯車アイコン()をクリックして設定ページを開きます。
- 設定ページで「Access Tokens」セクションに移動し、「 Create PAT」をクリックします。
-
PAT に名前を付けて「Create」をクリックします。
- Personal Access Token は作成時にのみ表示されるため、必ずコピーして安全な場所に保存してください。
接続と PAT が設定できたので、Alteryx からElasticsearch のデータに接続する準備が整いました。
Alteryx から Elasticsearch に接続
Alteryx Desktop から CData Connect AI Virtual SQL Server への接続を確立するには、以下のステップに従います。
- Alteryx でアカウントを設定します。
-
新しい「Input Data」ツールをワークフローにドラッグ&ドロップします。
- 「Input Data」ツールを選択した状態で、ナビゲーションパネルの「Set Up a Connection」をクリックします。「Data connections」ダイアログが表示されます。
-
「Data sources」をクリックします。「Microsoft SQL Server」>「Quick connect」を選択します。
- 「Connection Manager」ダイアログで「New」をクリックします。
-
「New Data Source」ダイアログで以下の情報を入力します。
- Data Source Name: Microsoft SQL Server ODBC DSN-less
- Driver: ドロップダウンリストから「ODBC Driver 18 for SQL Server」を選択
- Server: tds.cdata.com,14333
- Database: 接続する CData Connect AI データソースの接続名を入力(例: Elasticsearch1)
- 「Save」をクリックしてから「Connect Credential」をクリックします。
-
「Connections」で以下を入力します。
- Authentication Method: 「Username and password」を選択
- Credential: 「Create New Credential」を選択
- Credential Name: 資格情報を識別するための名前を入力
- Username: CData Connect AI のユーザー名を入力(CData Connect AI インターフェースの右上に表示されます。例: [email protected])
- Password: Settings ページで生成した PAT を入力
- 「Test Connection」をクリックします。成功したら「Create and link」をクリックします。
- 資格情報を使用して「Connect」します。
-
表示されるウィザードで、クエリするテーブルを「Query Builder box」にドラッグ&ドロップします。クエリに含めるフィールドのチェックボックスをオンにします。可能な場合、フィルタや集計によって生成された複雑なクエリはデータソースにプッシュダウンされ、サポートされていない操作(SQL 関数や JOIN 操作を含む場合があります)はコネクタに組み込まれた CData SQL エンジンによってクライアント側で処理されます。
-
データセットをさらにカスタマイズするには、SQL Editor を開いてクエリを手動で変更し、句、集計、その他の操作を追加して、必要なデータを正確に取得できるようにします。
-
クエリが定義できたら、Alteryx Designer でデータを操作する準備が整いました。
CData Connect AI を入手
SQL Server データベースから直接 300 以上の SaaS、ビッグデータ、NoSQL ソースへのリアルタイムデータアクセスを取得するには、CData Connect AI をお試しください。