ACL Analytics から Spark のデータに接続

Stanley Liu
Stanley Liu
Associate Technical Product Marketer
CData Connect AI を使って ACL Analytics からSpark のデータに接続し、リアルタイムデータでデータ分析ワークフローを実行できます。

ACL Analytics は Diligent HighBond の一部で、監査、リスク管理、コンプライアンスなどの目的で広く使われる強力なデータ分析ソフトウェアです。大量のデータを検査・分析して、異常やトレンド、潜在的なリスクや不正行為を特定できます。

CData Connect AI は Spark に接続するための専用クラウド間インターフェースを提供し、ACL Analytics から直接ライブSpark のデータを分析できます。ネイティブ対応データベースへのデータレプリケーションは不要です。CData Connect AI は最適化されたデータ処理機能を備えており、フィルタや JOIN を含むサポート対象のすべての SQL 操作を効率的に Spark へ直接送信します。サーバーサイド処理を活用することで、要求されたSpark のデータを迅速に取得できます。

ACL Analytics 用に Spark への接続を設定

ACL Analytics から Spark への接続は CData Connect AI を介して行います。ACL Analytics でSpark のデータを操作するには、まず CData Connect AI で Spark への接続を作成・設定します。

  1. Connect AI にログインして「Sources」をクリック、次に「 Add Connection」をクリック
  2. 接続を追加パネルから「Spark」を選択
  3. Spark に接続するために必要な認証プロパティを入力します。 Spark に接続するために必要な認証プロパティを入力します。

    SparkSQL への接続

    SparkSQL への接続を確立するには以下を指定します。

    • Server:SparkSQL をホストするサーバーのホスト名またはIP アドレスに設定。
    • Port:SparkSQL インスタンスへの接続用のポートに設定。
    • TransportMode:SparkSQL サーバーとの通信に使用するトランスポートモード。有効な入力値は、BINARY およびHTTP です。デフォルトではBINARY が選択されます。
    • AuthScheme:使用される認証スキーム。有効な入力値はPLAIN、LDAP、NOSASL、およびKERBEROS です。デフォルトではPLAIN が選択されます。

    Databricks への接続

    Databricks クラスターに接続するには、以下の説明に従ってプロパティを設定します。Note:必要な値は、「クラスター」に移動して目的のクラスターを選択し、 「Advanced Options」の下にある「JDBC/ODBC」タブを選択することで、Databricks インスタンスで見つけることができます。

    • Server:Databricks クラスターのサーバーのホスト名に設定。
    • Port:443
    • TransportMode:HTTP
    • HTTPPath:Databricks クラスターのHTTP パスに設定。
    • UseSSL:True
    • AuthScheme:PLAIN
    • User:'token' に設定。
    • Password:パーソナルアクセストークンに設定(値は、Databricks インスタンスの「ユーザー設定」ページに移動して「アクセストークン」タブを選択することで取得できます)。

  4. 「Save & Test」をクリック
  5. Spark 接続の追加ページで「Permissions」タブに移動し、ユーザーベースのアクセス許可を設定します。

Personal Access Token の作成

REST API、OData API、または Virtual SQL Server を介して Connect AI に接続する場合、Personal Access Token(PAT)を使用して Connect AI への接続を認証します。アクセスの粒度を維持するために、サービスごとに個別の PAT を作成することをお勧めします。

  1. Connect AI アプリの右上にある歯車アイコン()をクリックして設定ページを開きます。
  2. 設定ページで「Access Tokens」セクションに移動し、「 Create PAT」をクリックします。
  3. PAT に名前を付けて「Create」をクリックします。
  4. Personal Access Token は作成時にのみ表示されるため、必ずコピーして安全な場所に保存してください。

接続と PAT が設定できたので、ACL Analytics からSpark のデータに接続する準備が整いました。

ACL Analytics から Spark に接続

以下のステップでは、ACL Analytics から CData Connect AI に接続して新しい Spark データソースを作成する方法を説明します。CData Connect AI Virtual SQL Server を使用すると、SQL Server への接続をサポートするツールからデータに接続できます。Virtual SQL Server は従来の SQL Server の動作を模倣し、さまざまなクエリオプションをサポートしています。

  1. Analytics ファイルを開いた状態で、「Import」→「Database and application」を選択します。
  2. 新しい SQL Server 接続を作成します。
  3. 接続情報を設定します。
    • Server: tds.cdata.com
    • Port: 14333
    • Auth Scheme: Password
    • Username: Connect AI のユーザー名(例: [email protected]
    • Password: 上記 Connect AI ユーザーの PAT
    • Database: Spark 接続の名前(例: SparkSQL1)
  4. 「Test Connection」をクリック
  5. 「OK」をクリック
  6. これで ACL Analytics でSpark のデータを操作する準備が整いました。

アプリケーションからSpark のデータへのリアルタイム接続

ACL Analytics は Connect AI を介して直接ライブSpark のデータに接続できるようになり、データを複製することなくSpark のデータを分析できます。

300 以上の SaaS、ビッグデータ、NoSQL ソースへのリアルタイムデータアクセスをアプリケーションから直接取得するには、CData Connect AI をお試しください。

はじめる準備はできましたか?

CData Connect AI の詳細、または無料トライアルにお申し込みください:

無料トライアル お問い合わせ