CData Connect AI 経由でMicroStrategy からDatabricks のデータにリアルタイム連携

加藤龍彦
加藤龍彦
デジタルマーケティング
CData Connect AI でDatabricks へのリアルタイム接続を作成し、MicroStrategy からDatabricks のデータに接続します。

MicroStrategy は、データドリブンイノベーションを可能にする分析およびモバイルプラットフォームです。MicroStrategy とCData Connect AI を組み合わせると、MicroStrategy からデータベースと同じ感覚でリアルタイムDatabricks のデータにアクセスできるようになり、レポート機能と分析機能が拡張されます。この記事では、Connect AI でDatabricks に接続し、MicroStrategy でConnect AI に接続してDatabricks のデータの簡単なビジュアライゼーションを作成する方法について説明します。

クラウドベースの統合プラットフォームであるConnect AI は、クラウドベースのBI ツールや分析ツールの使用に理想的です。構成するサーバーやセットアップするデータプロキシがないため、Web ベースのUI を使用してDatabricks へのリアルタイム接続を作成し、MicroStrategy から接続してDatabricks のデータに基づくリアルタイムでの分析を開始できます。

Connect AI からDatabricks に接続する

CData Connect AI は直感的なクリック操作ベースのインターフェースを使ってデータソースに接続します。
  1. Connect AI にログインし、 Add Connection をクリックします。 コネクションを追加
  2. Add Connection パネルから「Databricks」を選択します。 データソースを選択
  3. 必要な認証情報を入力し、Databricks に接続します。

    Databricks 接続プロパティの取得・設定方法

    Databricks クラスターに接続するには、以下のプロパティを設定します。

    • Database:Databricks データベース名。
    • Server:Databricks クラスターのサーバーのホスト名
    • HTTPPath:Databricks クラスターのHTTP パス。
    • Token:個人用アクセストークン。この値は、Databricks インスタンスのユーザー設定ページに移動してアクセストークンタブを選択することで取得できます。
    Databricks インスタンスで必要な値は、クラスターに移動して目的のクラスターを選択し、Advanced Options の下にあるJDBC/ODBC タブを選択することで見つけることができます。

    Databricks への認証

    CData は、次の認証スキームをサポートしています。

    • 個人用アクセストークン
    • Microsoft Entra ID(Azure AD)
    • Azure サービスプリンシパル
    • OAuthU2M
    • OAuthM2M

    個人用アクセストークン

    認証するには、次を設定します。

    • AuthSchemePersonalAccessToken
    • Token:Databricks サーバーへの接続に使用するトークン。Databricks インスタンスのユーザー設定ページに移動してアクセストークンタブを選択することで取得できます。

    その他の認証方法については、ヘルプドキュメント の「はじめに」セクションを参照してください。

    Configuring a connection (Salesforce is showe)
  4. Create & Test をクリックします。
  5. Add Databricks Connection ページのPermissions タブに移動し、ユーザーベースのアクセス許可を更新します。 権限の更新

パーソナルアクセストークンを追加する

OAuth 認証をサポートしないサービス、アプリケーション、プラットフォーム、フレームワークから接続する場合、パーソナルアクセストークン(Personal Access Token, PAT)を認証に使用できます。きめ細かくアクセスを管理するために、サービスごとに個別のPAT を作成するのがベストプラクティスです。

  1. Connect AI アプリの右上にあるユーザー名をクリックし、User Profile をクリックします。
  2. User Profile ページで、Personal Access Tokens セクションまでスクロールし、Create PAT をクリックします。
  3. PAT に名前を付け、Create をクリックします。 新しいPAT を作成
  4. パーソナルアクセストークンは作成時にしか表示されないため、必ずコピーして安全に保存してください。

接続が構成されたら、MicroStrategy からDatabricks のデータに接続できるようになります。

MicroStrategy を使用してDatabricks のデータに接続し、ビジュアライズする

ネイティブSQL Server 機能を使ってデータソースを追加することにより、MicroStrategy からDatabricks に接続できます。データソースを作成したら、MicroStrategy でDatabricks のデータの動的なビジュアライゼーションを構築できます。

  1. MicroStrategy を開き、アカウントを選択します。
  2. [Add External Data]をクリックし、[Databases]を選択して[Import Option]として[Select Tables]を使用します。 Adding External Data
  3. Import from Tables ウィザードでクリックして新しいデータソースを追加します。
  4. Database メニューで「SQL Server」を選択し、Version メニューで「SQL Server 2017」を選択します。
  5. 接続プロパティを以下のように設定します。
    • Server Nametds.cdata.com
    • Port Number:14333
    • Database Name:Databricks コネクションの名前(例: Databricks1)
    • User:Connect AI ユーザー
    • Password:Connect AI ユーザーのPAT
    • Data Source Name:「CData Cloud Databricks」のような新しい外部データソースの名前
  6. 新しいデータソースのメニューを展開し、「Edit Catalog Options」を選択します。Edit the catalog options.
  7. 「SQL statement retreive columns ...」クエリを編集してWHERE 句にTABLE_SCHEMA = '#?Schema_Name?#' を含め、Apply -> OK の順にクリックします。(以下は完全なクエリです)

    SELECT DISTINCT
      TABLE_SCHEMA NAME_SPACE,
      TABLE_NAME TAB_NAME,
      COLUMN_NAME COL_NAME,
      (CASE
        WHEN
          (DATA_TYPE LIKE '%char' AND (CHARACTER_SET_NAME='utf8' OR CHARACTER_SET_NAME='usc2'))
        THEN
          CONCAT('a',DATA_TYPE)
        ELSE
          DATA_TYPE
      END) DATA_TYPE,
      CHARACTER_MAXIMUM_LENGTH DATA_LEN,
      NUMERIC_PRECISION DATA_PREC,
      NUMERIC_SCALE DATA_SCALE
    FROM
      INFORMATION_SCHEMA.COLUMNS
    WHERE
      TABLE_NAME
    IN
      (#TABLE_LIST#) AND TABLE_SCHEMA='#?Schema_Name?#'
    ORDER BY
      1,2,3
    
  8. 新しいデータソースを選択し、仮想Databricks のデータベースに対応するNamespace を選択します。(Databricks1 など)
  9. テーブルをペインにドラッグして追加します。 Select tables to insert. Note:リアルタイム接続を作成するため、テーブル全体を追加し、MicroStrategy 製品に固有のフィルタリングおよび集計機能を利用してデータセットをカスタマイズできます。
  10. [Finish]をクリックして、リアルタイム接続するオプションを選択してクエリを保存し、新しいドシエを作成するオプションを選択します。CData Connect AI の高性能データ処理によってリアルタイム接続が効果的に実現できます。 Save the query and create a new dossier.
  11. ビジュアライゼーションを選択して表示するフィールドを選択し、フィルタを適用してDatabricks のデータの新しいビジュアライゼーションを作成します。データ型は、動的なメタデータ検出によって自動的に検出されます。可能であれば、フィルタと集計によって生成された複雑なクエリはDatabricks にプッシュダウンされ、サポートされていない操作(SQL 関数とJOIN 操作を含む)は、Connect AI に組み込まれたCData SQL エンジンによって管理されます。 Visualize Databricks のデータ.
  12. ドシエの設定が完了したら、File -> Save とクリックします。

MicroStrategy とともにCData Connect AI を使用することで、Databricks のデータで強固なビジュアライゼーションとレポートを簡単に作成できます。Databricks(および100を超えるほかのデータソース)に接続する方法の詳細については、Connect AI ページにアクセスしてください。無償トライアルにサインアップして、MicroStrategy でリアルタイムDatabricks のデータの操作をはじめましょう。

はじめる準備はできましたか?

CData Connect AI の詳細、または無料トライアルにお申し込みください:

無料トライアル お問い合わせ