ACL Analytics から Databricks のデータに接続
ACL Analytics は Diligent HighBond の一部で、監査、リスク管理、コンプライアンスなどの目的で広く使われる強力なデータ分析ソフトウェアです。大量のデータを検査・分析して、異常やトレンド、潜在的なリスクや不正行為を特定できます。
CData Connect AI は Databricks に接続するための専用クラウド間インターフェースを提供し、ACL Analytics から直接ライブDatabricks のデータを分析できます。ネイティブ対応データベースへのデータレプリケーションは不要です。CData Connect AI は最適化されたデータ処理機能を備えており、フィルタや JOIN を含むサポート対象のすべての SQL 操作を効率的に Databricks へ直接送信します。サーバーサイド処理を活用することで、要求されたDatabricks のデータを迅速に取得できます。
Databricks データ連携について
CData を使用すれば、Databricks のライブデータへのアクセスと統合がこれまでになく簡単になります。お客様は CData の接続機能を以下の目的で利用しています:
- Runtime バージョン 9.1 - 13.X から Pro および Classic Databricks SQL バージョンまで、すべてのバージョンの Databricks にアクセスできます。
- あらゆるホスティングソリューションとの互換性により、お好みの環境で Databricks を使用し続けることができます。
- パーソナルアクセストークン、Azure サービスプリンシパル、Azure AD など、さまざまな方法で安全に認証できます。
- Databricks ファイルシステム、Azure Blob ストレージ、AWS S3 ストレージを使用して Databricks にデータをアップロードできます。
多くのお客様が、さまざまなシステムから Databricks データレイクハウスにデータを移行するために CData のソリューションを使用していますが、ライブ接続ソリューションを使用して、データベースと Databricks 間の接続をフェデレートしているお客様も多数います。これらのお客様は、SQL Server リンクサーバーまたは Polybase を使用して、既存の RDBMS 内から Databricks へのライブアクセスを実現しています。
一般的な Databricks のユースケースと CData のソリューションがデータの問題解決にどのように役立つかについては、ブログをご覧ください:What is Databricks Used For? 6 Use Cases
はじめに
ACL Analytics 用に Databricks への接続を設定
ACL Analytics から Databricks への接続は CData Connect AI を介して行います。ACL Analytics でDatabricks のデータを操作するには、まず CData Connect AI で Databricks への接続を作成・設定します。
- Connect AI にログインして「Sources」をクリック、次に「 Add Connection」をクリック
- 接続を追加パネルから「Databricks」を選択
- Databricks に接続するために必要な認証プロパティを入力します。
Databricks に接続するために必要な認証プロパティを入力します。
Databricks 接続プロパティの取得・設定方法
Databricks クラスターに接続するには、以下のプロパティを設定します。
- Database:Databricks データベース名。
- Server:Databricks クラスターのサーバーのホスト名。
- HTTPPath:Databricks クラスターのHTTP パス。
- Token:個人用アクセストークン。この値は、Databricks インスタンスのユーザー設定ページに移動してアクセストークンタブを選択することで取得できます。
Databricks への認証
CData は、次の認証スキームをサポートしています。
- 個人用アクセストークン
- Microsoft Entra ID(Azure AD)
- Azure サービスプリンシパル
- OAuthU2M
- OAuthM2M
個人用アクセストークン
認証するには、次を設定します。
- AuthScheme:PersonalAccessToken。
- Token:Databricks サーバーへの接続に使用するトークン。Databricks インスタンスのユーザー設定ページに移動してアクセストークンタブを選択することで取得できます。
その他の認証方法については、ヘルプドキュメント の「はじめに」セクションを参照してください。
- 「Save & Test」をクリック
-
Databricks 接続の追加ページで「Permissions」タブに移動し、ユーザーベースのアクセス許可を設定します。
Personal Access Token の作成
REST API、OData API、または Virtual SQL Server を介して Connect AI に接続する場合、Personal Access Token(PAT)を使用して Connect AI への接続を認証します。アクセスの粒度を維持するために、サービスごとに個別の PAT を作成することをお勧めします。
- Connect AI アプリの右上にある歯車アイコン()をクリックして設定ページを開きます。
- 設定ページで「Access Tokens」セクションに移動し、「 Create PAT」をクリックします。
-
PAT に名前を付けて「Create」をクリックします。
- Personal Access Token は作成時にのみ表示されるため、必ずコピーして安全な場所に保存してください。
接続と PAT が設定できたので、ACL Analytics からDatabricks のデータに接続する準備が整いました。
ACL Analytics から Databricks に接続
以下のステップでは、ACL Analytics から CData Connect AI に接続して新しい Databricks データソースを作成する方法を説明します。CData Connect AI Virtual SQL Server を使用すると、SQL Server への接続をサポートするツールからデータに接続できます。Virtual SQL Server は従来の SQL Server の動作を模倣し、さまざまなクエリオプションをサポートしています。
- Analytics ファイルを開いた状態で、「Import」→「Database and application」を選択します。
- 新しい SQL Server 接続を作成します。
- 接続情報を設定します。
- Server: tds.cdata.com
- Port: 14333
- Auth Scheme: Password
- Username: Connect AI のユーザー名(例: [email protected])
- Password: 上記 Connect AI ユーザーの PAT
- Database: Databricks 接続の名前(例: Databricks1)
- 「Test Connection」をクリック
- 「OK」をクリック
- これで ACL Analytics でDatabricks のデータを操作する準備が整いました。
アプリケーションからDatabricks のデータへのリアルタイム接続
ACL Analytics は Connect AI を介して直接ライブDatabricks のデータに接続できるようになり、データを複製することなくDatabricks のデータを分析できます。
300 以上の SaaS、ビッグデータ、NoSQL ソースへのリアルタイムデータアクセスをアプリケーションから直接取得するには、CData Connect AI をお試しください。