SAS Viya で Elasticsearch のリアルタイムデータを分析

Dibyendu Datta
Dibyendu Datta
Lead Technology Evangelist
CData Connect AI を使用して SAS Viya からElasticsearch のデータに接続し、リアルタイムデータでセルフサービス分析を実現する方法を解説します。

SAS Viya は、データ管理、機械学習、分析を強化し、効率的な意思決定とインサイトの創出を促進する分析プラットフォームです。CData Connect AI と組み合わせることで、クラウド間でリアルタイムにElasticsearch のデータにアクセスし、予測モデルの構築やデータドリブンな意思決定のためのインサイト作成など、さまざまな用途に活用できます。この記事では、SAS Viya クラウドプラットフォームから Connect AI に接続し、セルフサービス AI と分析のデプロイメントにElasticsearch のデータを統合する方法をご紹介します。

CData Connect AI は、Elasticsearch 向けに純粋な SQL インターフェースをクラウド間で提供します。これにより、データをレプリケーションすることなく、SAS Viya でElasticsearch のデータに簡単に接続できます。Connect AI は SAS Viya からは SQL Server データベースとまったく同じように見え、フィルタや JOIN などの SQL 操作をElasticsearchに直接プッシュする最適化されたデータ処理により、サーバーサイド処理を活用してElasticsearch のデータをすばやく取得します。

Elasticsearch データ連携について

CData を使用すれば、Elasticsearch のライブデータへのアクセスと統合がこれまでになく簡単になります。お客様は CData の接続機能を以下の目的で利用しています:

  • SQL エンドポイントと REST エンドポイントの両方にアクセスでき、接続を最適化し、Elasticsearch データの読み書きに関してより多くのオプションを提供します。
  • v2.2 以降およびオープンソース Elasticsearch サブスクリプションを含む、ほぼすべての Elasticsearch インスタンスに接続できます。
  • SCORE() 関数を明示的に要求することなく、常にクエリ結果の関連性スコアを受け取ることができます。これにより、サードパーティツールからのアクセスが簡素化され、クエリ結果のテキスト関連性のランキングを簡単に確認できます。
  • 複数のインデックスを検索でき、クライアントマシンではなく Elasticsearch がクエリと結果の管理・処理を担当します。

ユーザーは、Crystal Reports、Power BI、Excel などの分析ツールと Elasticsearch データを統合し、当社のツールを活用して、Elasticsearch を含むすべてのデータソースへの単一のフェデレートアクセスレイヤーを実現しています。

CData の Elasticsearch ソリューションの詳細については、ナレッジベース記事をご覧ください:CData Elasticsearch Driver Features & Differentiators


はじめに


Elasticsearch への接続を設定(SAS Viya 向け)

SAS Viya から Elasticsearch への接続は、CData Connect AI を介して行います。それでは、Elasticsearch のデータを SAS Viya から利用できるようにするため、Elasticsearch への接続を作成していきましょう。

  1. Connect AI にログインして「Sources」をクリック、次に「 Add Connection」をクリック
  2. 接続を追加パネルから「Elasticsearch」を選択
  3. Elasticsearch に接続するために必要な認証プロパティを入力します。

    Elasticsearch 接続プロパティの取得・設定方法

    接続するには、Server およびPort 接続プロパティを設定します。 認証には、User とPassword プロパティ、PKI (public key infrastructure)、またはその両方を設定します。 PKI を使用するには、SSLClientCert、SSLClientCertType、SSLClientCertSubject、およびSSLClientCertPassword プロパティを設定します。

    CData 製品は、認証とTLS/SSL 暗号化にX-Pack Security を使用しています。TLS/SSL で接続するには、Server 値に'https://' を接頭します。Note: PKI を 使用するためには、TLS/SSL およびクライアント認証はX-Pack 上で有効化されていなければなりません。

    接続されると、X-Pack では、設定したリルムをベースにユーザー認証およびロールの許可が実施されます。

  4. 「Save & Test」をクリック
  5. Elasticsearch 接続の追加ページで「Permissions」タブに移動し、ユーザーベースの権限を更新します。

パーソナルアクセストークンを追加

REST API、OData API、または仮想 SQL Server を通じて Connect AI に接続する場合は、パーソナルアクセストークン(PAT)を使用して認証を行います。アクセス管理を細かく制御するため、サービスごとに個別の PAT を作成することをお勧めします。

  1. Connect AI アプリの右上にある歯車アイコン()をクリックして設定ページを開きます。
  2. 設定ページで「Access Tokens」セクションに移動し、「 Create PAT」をクリックします。
  3. PAT に名前を付けて「Create」をクリックします。
  4. パーソナルアクセストークンは作成時にのみ表示されます。必ずコピーして、今後の利用のために安全に保管してください。

接続の設定と PAT の生成が完了したら、SAS Viya からElasticsearch のデータに接続する準備は完了です。

SAS Viya から CData Connect AI に接続

以下の手順で、CData Connect AI で確立した接続を使用して Elasticsearch から SAS Viya にデータを読み込む方法を説明します。

  1. CData Connect AI JDBC ドライバーをダウンロードしてインストールします。
    • CData Connect AI の Integrations ページを開きます。
    • JDBC を検索して選択します。
    • セットアップファイルをダウンロードして実行します。
    • インストールが完了すると、JAR ファイルはインストールディレクトリ(lib フォルダ内)に配置されます。
  2. SAS Viya にログインし、左上の Applications Menu に移動します。
  3. Analytics Life Cycle トピックから Develop Code and Flows を選択します。
  4. Explorer タブに移動し、左パネルの SAS Server をクリックします。
  5. 以下の手順で CData Connect JDBC ドライバーの JAR ファイルをアップロードします。
    • 「Home」ディレクトリを右クリックします。
    • Upload files をクリックします。
    • 指定された場所に JAR ファイルを配置し、ファイルパスをメモします。
  6. 完了したら、Libraries タブに移動し、CData Connect JDBC 用の Create a new library connection(以下に示すように左上隅)をクリックします。
  7. ライブラリ接続設定を入力します。
    • Connection name: 接続の名前を入力
    • Library name (libref): ライブラリの参照名を入力
    • Library type: 「SAS/ACCESS to JDBC」を選択
  8. Properties タブをクリックし、Library attributesREADONLY に設定します。
  9. 「Connection Options」タブをクリックし、以下の詳細を入力します。
    • Hive JDBC driver's class name: cdata.jdbc.connect.ConnectDriver
    • Java CLASSPATH: JAR ドライバーファイルへのファイルパスを入力(手順 5 を参照)
  10. Test connection をクリックします。成功したら、Save and connect をクリックします。
  11. をクリックして新しいタブを追加し、SAS program を選択します。
  12. 以下のコードブロックに設定パラメータを入力します。
    • Libref: 手順 9 で定義したライブラリ参照名を入力
    • ClassPath: JAR ドライバーファイルへのファイルパスを入力
    • Username: CData Connect のユーザー名を入力。CData Connect インターフェースの右上に表示されています(例: [email protected]
    • DefaultCatalog: クエリを実行したい CData Connect AI で設定した接続を入力
    • Password: 「パーソナルアクセストークンを追加」セクションで生成した PAT を入力
    libname [Libref] JDBC
    classpath=[ClassPath]
    class="cdata.jdbc.connect.ConnectDriver"
    URL="jdbc:Connect:AuthScheme=Basic;User=[Username];DefaultCatalog=[DefaultCatalog];DefaultSchema=dbo;Password=[PAT]";
    
    proc sql;
    
    SELECT * FROM [Libref].MyTable;
    
    quit;
    
  13. Run をクリックします。CData Connect AI から SAS Viya にデータが読み込まれるのを確認できます。

クラウドアプリケーションから Elasticsearch へのリアルタイムアクセス

これで、SAS Viya からElasticsearch のデータへのダイレクトなクラウド間接続が完成しました。データをレプリケーションすることなく、予測モデルの構築、データドリブンな意思決定のためのインサイト作成など、さまざまな用途に活用できます。

Connect AI をお試しいただき、300 以上の SaaS、ビッグデータ、NoSQL ソースへのリアルタイムデータアクセスをクラウドアプリケーションから直接実現してください。

はじめる準備はできましたか?

CData Connect AI の詳細、または無料トライアルにお申し込みください:

無料トライアル お問い合わせ