SAS Viya で Redshift のリアルタイムデータを分析

Dibyendu Datta
Dibyendu Datta
Lead Technology Evangelist
CData Connect AI を使用して SAS Viya からRedshift のデータに接続し、リアルタイムデータでセルフサービス分析を実現する方法を解説します。

SAS Viya は、データ管理、機械学習、分析を強化し、効率的な意思決定とインサイトの創出を促進する分析プラットフォームです。CData Connect AI と組み合わせることで、クラウド間でリアルタイムにRedshift のデータにアクセスし、予測モデルの構築やデータドリブンな意思決定のためのインサイト作成など、さまざまな用途に活用できます。この記事では、SAS Viya クラウドプラットフォームから Connect AI に接続し、セルフサービス AI と分析のデプロイメントにRedshift のデータを統合する方法をご紹介します。

CData Connect AI は、Redshift 向けに純粋な SQL インターフェースをクラウド間で提供します。これにより、データをレプリケーションすることなく、SAS Viya でRedshift のデータに簡単に接続できます。Connect AI は SAS Viya からは SQL Server データベースとまったく同じように見え、フィルタや JOIN などの SQL 操作をRedshiftに直接プッシュする最適化されたデータ処理により、サーバーサイド処理を活用してRedshift のデータをすばやく取得します。

Redshift への接続を設定(SAS Viya 向け)

SAS Viya から Redshift への接続は、CData Connect AI を介して行います。それでは、Redshift のデータを SAS Viya から利用できるようにするため、Redshift への接続を作成していきましょう。

  1. Connect AI にログインして「Sources」をクリック、次に「 Add Connection」をクリック
  2. 接続を追加パネルから「Redshift」を選択
  3. Redshift に接続するために必要な認証プロパティを入力します。

    Amazon Redshift への接続

    それでは、早速Amazon Redshift に接続していきましょう。データに接続するには、以下の接続パラメータを指定します。

    • Server:Amazon Redshift データベースをホスティングしているサーバーのホスト名またはIP アドレス
    • Database:Amazon Redshift クラスター用に作成したデータベース
    • Port(オプション):Amazon Redshift データベースをホスティングしているサーバーのポート。デフォルトは5439です

    これらの値は、以下のステップでAWS マネージメントコンソールから取得できます。

    1. Amazon Redshift コンソールを開きます(http://console.aws.amazon.com/redshift)
    2. Clusters ページで、クラスター名をクリックしてください
    3. Configuration タブの"Cluster Database Properties" セクションからプロパティを取得します。接続プロパティの値は、ODBC URL で設定された値と同じになります

    Amazon Redshiftへの認証

    CData 製品では幅広い認証オプションに対応しています。標準認証情報からIAM クレデンシャル、ADFS、Ping Federate、Microsoft Entra ID(Azure AD)、Azure AD PKCE まで利用可能です。

    標準認証

    ログイン資格情報を使用してAmazon Redshift に接続するには、以下のプロパティを設定してみましょう。
    • AuthSchemeBasic
    • User:認証するユーザーのログイン情報
    • Password:認証するユーザーのパスワード

    その他の認証方法については、ヘルプドキュメントをご確認ください。

  4. 「Save & Test」をクリック
  5. Redshift 接続の追加ページで「Permissions」タブに移動し、ユーザーベースの権限を更新します。

パーソナルアクセストークンを追加

REST API、OData API、または仮想 SQL Server を通じて Connect AI に接続する場合は、パーソナルアクセストークン(PAT)を使用して認証を行います。アクセス管理を細かく制御するため、サービスごとに個別の PAT を作成することをお勧めします。

  1. Connect AI アプリの右上にある歯車アイコン()をクリックして設定ページを開きます。
  2. 設定ページで「Access Tokens」セクションに移動し、「 Create PAT」をクリックします。
  3. PAT に名前を付けて「Create」をクリックします。
  4. パーソナルアクセストークンは作成時にのみ表示されます。必ずコピーして、今後の利用のために安全に保管してください。

接続の設定と PAT の生成が完了したら、SAS Viya からRedshift のデータに接続する準備は完了です。

SAS Viya から CData Connect AI に接続

以下の手順で、CData Connect AI で確立した接続を使用して Redshift から SAS Viya にデータを読み込む方法を説明します。

  1. CData Connect AI JDBC ドライバーをダウンロードしてインストールします。
    • CData Connect AI の Integrations ページを開きます。
    • JDBC を検索して選択します。
    • セットアップファイルをダウンロードして実行します。
    • インストールが完了すると、JAR ファイルはインストールディレクトリ(lib フォルダ内)に配置されます。
  2. SAS Viya にログインし、左上の Applications Menu に移動します。
  3. Analytics Life Cycle トピックから Develop Code and Flows を選択します。
  4. Explorer タブに移動し、左パネルの SAS Server をクリックします。
  5. 以下の手順で CData Connect JDBC ドライバーの JAR ファイルをアップロードします。
    • 「Home」ディレクトリを右クリックします。
    • Upload files をクリックします。
    • 指定された場所に JAR ファイルを配置し、ファイルパスをメモします。
  6. 完了したら、Libraries タブに移動し、CData Connect JDBC 用の Create a new library connection(以下に示すように左上隅)をクリックします。
  7. ライブラリ接続設定を入力します。
    • Connection name: 接続の名前を入力
    • Library name (libref): ライブラリの参照名を入力
    • Library type: 「SAS/ACCESS to JDBC」を選択
  8. Properties タブをクリックし、Library attributesREADONLY に設定します。
  9. 「Connection Options」タブをクリックし、以下の詳細を入力します。
    • Hive JDBC driver's class name: cdata.jdbc.connect.ConnectDriver
    • Java CLASSPATH: JAR ドライバーファイルへのファイルパスを入力(手順 5 を参照)
  10. Test connection をクリックします。成功したら、Save and connect をクリックします。
  11. をクリックして新しいタブを追加し、SAS program を選択します。
  12. 以下のコードブロックに設定パラメータを入力します。
    • Libref: 手順 9 で定義したライブラリ参照名を入力
    • ClassPath: JAR ドライバーファイルへのファイルパスを入力
    • Username: CData Connect のユーザー名を入力。CData Connect インターフェースの右上に表示されています(例: [email protected]
    • DefaultCatalog: クエリを実行したい CData Connect AI で設定した接続を入力
    • Password: 「パーソナルアクセストークンを追加」セクションで生成した PAT を入力
    libname [Libref] JDBC
    classpath=[ClassPath]
    class="cdata.jdbc.connect.ConnectDriver"
    URL="jdbc:Connect:AuthScheme=Basic;User=[Username];DefaultCatalog=[DefaultCatalog];DefaultSchema=dbo;Password=[PAT]";
    
    proc sql;
    
    SELECT * FROM [Libref].MyTable;
    
    quit;
    
  13. Run をクリックします。CData Connect AI から SAS Viya にデータが読み込まれるのを確認できます。

クラウドアプリケーションから Redshift へのリアルタイムアクセス

これで、SAS Viya からRedshift のデータへのダイレクトなクラウド間接続が完成しました。データをレプリケーションすることなく、予測モデルの構築、データドリブンな意思決定のためのインサイト作成など、さまざまな用途に活用できます。

Connect AI をお試しいただき、300 以上の SaaS、ビッグデータ、NoSQL ソースへのリアルタイムデータアクセスをクラウドアプリケーションから直接実現してください。

はじめる準備はできましたか?

CData Connect AI の詳細、または無料トライアルにお申し込みください:

無料トライアル お問い合わせ