CData Connect AI 経由でMicroStrategy からAzure Data Lake Storage のデータにリアルタイム連携

加藤龍彦
加藤龍彦
デジタルマーケティング
CData Connect AI でAzure Data Lake Storage へのリアルタイム接続を作成し、MicroStrategy からAzure Data Lake Storage のデータに接続します。

MicroStrategy は、データドリブンイノベーションを可能にする分析およびモバイルプラットフォームです。MicroStrategy とCData Connect AI を組み合わせると、MicroStrategy からデータベースと同じ感覚でリアルタイムAzure Data Lake Storage のデータにアクセスできるようになり、レポート機能と分析機能が拡張されます。この記事では、Connect AI でAzure Data Lake Storage に接続し、MicroStrategy でConnect AI に接続してAzure Data Lake Storage のデータの簡単なビジュアライゼーションを作成する方法について説明します。

クラウドベースの統合プラットフォームであるConnect AI は、クラウドベースのBI ツールや分析ツールの使用に理想的です。構成するサーバーやセットアップするデータプロキシがないため、Web ベースのUI を使用してAzure Data Lake Storage へのリアルタイム接続を作成し、MicroStrategy から接続してAzure Data Lake Storage のデータに基づくリアルタイムでの分析を開始できます。

Connect AI からAzure Data Lake Storage に接続する

CData Connect AI は直感的なクリック操作ベースのインターフェースを使ってデータソースに接続します。
  1. Connect AI にログインし、 Add Connection をクリックします。 コネクションを追加
  2. Add Connection パネルから「Azure Data Lake Storage」を選択します。 データソースを選択
  3. 必要な認証情報を入力し、Azure Data Lake Storage に接続します。

    Azure Data Lake Storage 接続プロパティの取得・設定方法

    Azure Data Lake Storage Gen2 への接続

    それでは、Gen2 Data Lake Storage アカウントに接続していきましょう。接続するには、以下のプロパティを設定します。

    • Account:ストレージアカウントの名前
    • FileSystem:このアカウントに使用されるファイルシステム名。例えば、Azure Blob コンテナの名前
    • Directory(オプション):レプリケートされたファイルが保存される場所へのパス。パスが指定されない場合、ファイルはルートディレクトリに保存されます

    Azure Data Lake Storage Gen2への認証

    続いて、認証方法を設定しましょう。CData 製品では、5つの認証方法をサポートしています:アクセスキー(AccessKey)の使用、共有アクセス署名(SAS)の使用、Azure Active Directory OAuth(AzureAD)経由、Azure サービスプリンシパル(AzureServicePrincipal またはAzureServicePrincipalCert)経由、およびManaged Service Identity(AzureMSI)経由です。

    アクセスキー

    アクセスキーを使用して接続するには、まずADLS Gen2ストレージアカウントで利用可能なアクセスキーを取得する必要があります。

    Azure ポータルでの手順は以下のとおりです:

    1. ADLS Gen2ストレージアカウントにアクセスします
    2. 設定でアクセスキーを選択します
    3. 利用可能なアクセスキーの1つの値をAccessKey 接続プロパティにコピーします

    接続の準備ができたら、以下のプロパティを設定してください。

    • AuthSchemeAccessKey
    • AccessKey:先ほどAzure ポータルで取得したアクセスキーの値

    共有アクセス署名(SAS)

    共有アクセス署名を使用して接続するには、まずAzure Storage Explorer ツールを使用して署名を生成する必要があります。

    接続の準備ができたら、以下のプロパティを設定してください。

    • AuthSchemeSAS
    • SharedAccessSignature:先ほど生成した共有アクセス署名の値

    その他の認証方法については、 href="/kb/help/" target="_blank">ヘルプドキュメントの「Azure Data Lake Storage Gen2への認証」セクションをご確認ください。

    Configuring a connection (Salesforce is showe)
  4. Create & Test をクリックします。
  5. Add Azure Data Lake Storage Connection ページのPermissions タブに移動し、ユーザーベースのアクセス許可を更新します。 権限の更新

パーソナルアクセストークンを追加する

OAuth 認証をサポートしないサービス、アプリケーション、プラットフォーム、フレームワークから接続する場合、パーソナルアクセストークン(Personal Access Token, PAT)を認証に使用できます。きめ細かくアクセスを管理するために、サービスごとに個別のPAT を作成するのがベストプラクティスです。

  1. Connect AI アプリの右上にあるユーザー名をクリックし、User Profile をクリックします。
  2. User Profile ページで、Personal Access Tokens セクションまでスクロールし、Create PAT をクリックします。
  3. PAT に名前を付け、Create をクリックします。 新しいPAT を作成
  4. パーソナルアクセストークンは作成時にしか表示されないため、必ずコピーして安全に保存してください。

接続が構成されたら、MicroStrategy からAzure Data Lake Storage のデータに接続できるようになります。

MicroStrategy を使用してAzure Data Lake Storage のデータに接続し、ビジュアライズする

ネイティブSQL Server 機能を使ってデータソースを追加することにより、MicroStrategy からAzure Data Lake Storage に接続できます。データソースを作成したら、MicroStrategy でAzure Data Lake Storage のデータの動的なビジュアライゼーションを構築できます。

  1. MicroStrategy を開き、アカウントを選択します。
  2. [Add External Data]をクリックし、[Databases]を選択して[Import Option]として[Select Tables]を使用します。 Adding External Data
  3. Import from Tables ウィザードでクリックして新しいデータソースを追加します。
  4. Database メニューで「SQL Server」を選択し、Version メニューで「SQL Server 2017」を選択します。
  5. 接続プロパティを以下のように設定します。
    • Server Nametds.cdata.com
    • Port Number:14333
    • Database Name:Azure Data Lake Storage コネクションの名前(例: ADLS1)
    • User:Connect AI ユーザー
    • Password:Connect AI ユーザーのPAT
    • Data Source Name:「CData Cloud Azure Data Lake Storage」のような新しい外部データソースの名前
  6. 新しいデータソースのメニューを展開し、「Edit Catalog Options」を選択します。Edit the catalog options.
  7. 「SQL statement retreive columns ...」クエリを編集してWHERE 句にTABLE_SCHEMA = '#?Schema_Name?#' を含め、Apply -> OK の順にクリックします。(以下は完全なクエリです)

    SELECT DISTINCT
      TABLE_SCHEMA NAME_SPACE,
      TABLE_NAME TAB_NAME,
      COLUMN_NAME COL_NAME,
      (CASE
        WHEN
          (DATA_TYPE LIKE '%char' AND (CHARACTER_SET_NAME='utf8' OR CHARACTER_SET_NAME='usc2'))
        THEN
          CONCAT('a',DATA_TYPE)
        ELSE
          DATA_TYPE
      END) DATA_TYPE,
      CHARACTER_MAXIMUM_LENGTH DATA_LEN,
      NUMERIC_PRECISION DATA_PREC,
      NUMERIC_SCALE DATA_SCALE
    FROM
      INFORMATION_SCHEMA.COLUMNS
    WHERE
      TABLE_NAME
    IN
      (#TABLE_LIST#) AND TABLE_SCHEMA='#?Schema_Name?#'
    ORDER BY
      1,2,3
    
  8. 新しいデータソースを選択し、仮想Azure Data Lake Storage のデータベースに対応するNamespace を選択します。(ADLS1 など)
  9. テーブルをペインにドラッグして追加します。 Select tables to insert. Note:リアルタイム接続を作成するため、テーブル全体を追加し、MicroStrategy 製品に固有のフィルタリングおよび集計機能を利用してデータセットをカスタマイズできます。
  10. [Finish]をクリックして、リアルタイム接続するオプションを選択してクエリを保存し、新しいドシエを作成するオプションを選択します。CData Connect AI の高性能データ処理によってリアルタイム接続が効果的に実現できます。 Save the query and create a new dossier.
  11. ビジュアライゼーションを選択して表示するフィールドを選択し、フィルタを適用してAzure Data Lake Storage のデータの新しいビジュアライゼーションを作成します。データ型は、動的なメタデータ検出によって自動的に検出されます。可能であれば、フィルタと集計によって生成された複雑なクエリはAzure Data Lake Storage にプッシュダウンされ、サポートされていない操作(SQL 関数とJOIN 操作を含む)は、Connect AI に組み込まれたCData SQL エンジンによって管理されます。 Visualize Azure Data Lake Storage のデータ.
  12. ドシエの設定が完了したら、File -> Save とクリックします。

MicroStrategy とともにCData Connect AI を使用することで、Azure Data Lake Storage のデータで強固なビジュアライゼーションとレポートを簡単に作成できます。Azure Data Lake Storage(および100を超えるほかのデータソース)に接続する方法の詳細については、Connect AI ページにアクセスしてください。無償トライアルにサインアップして、MicroStrategy でリアルタイムAzure Data Lake Storage のデータの操作をはじめましょう。

はじめる準備はできましたか?

CData Connect AI の詳細、または無料トライアルにお申し込みください:

無料トライアル お問い合わせ