Connect Spreadsheets 経由で Google Sheets からDatabricks ののデータにリアルタイムアクセス

Cameron Leblanc
Cameron Leblanc
Technology Evangelist
CData Connect Spreadsheets を使って、Google Sheets からDatabricks のデータにリアルタイムでアクセスできます。

Connect AI をお探しですか?

Connect AI アカウントには Connect Spreadsheets が含まれているため、以下の手順をそのままご利用いただけます。Connect Spreadsheets プラットフォームの参照時に若干の違いがある場合がありますが、基本的な操作は同じです。


Google Sheets は、Google が提供するウェブベースのスプレッドシートプログラムです。CData Connect Spreadsheets と連携することで、Google Sheets から直接Databricks のデータに簡単にアクセスでき、データ分析、コラボレーション、計算などのタスクを実行できます。この記事では、Connect Spreadsheets で Databricks に接続し、Google Sheets でシームレスにDatabricks のデータにリアルタイムアクセスする方法を詳しく説明します。

Connect Spreadsheets は、Microsoft Excel や Google Sheets にライブデータを取り込む最も簡単な方法です。ファイルのダウンロード、加工、アップロードといった作業は不要になります。データに接続し、必要なデータセットを選択して、スプレッドシートにインポートするだけです。

このセットアップには、Connect Spreadsheets アカウントと Connect Spreadsheets Google Sheets アドオンが必要です。Connect Spreadsheets の無料アカウントにサインアップし、無料の Connect Spreadsheets Google Sheets アドオンをインストールしてください。


Databricks データ連携について

CData を使用すれば、Databricks のライブデータへのアクセスと統合がこれまでになく簡単になります。お客様は CData の接続機能を以下の目的で利用しています:

  • Runtime バージョン 9.1 - 13.X から Pro および Classic Databricks SQL バージョンまで、すべてのバージョンの Databricks にアクセスできます。
  • あらゆるホスティングソリューションとの互換性により、お好みの環境で Databricks を使用し続けることができます。
  • パーソナルアクセストークン、Azure サービスプリンシパル、Azure AD など、さまざまな方法で安全に認証できます。
  • Databricks ファイルシステム、Azure Blob ストレージ、AWS S3 ストレージを使用して Databricks にデータをアップロードできます。

多くのお客様が、さまざまなシステムから Databricks データレイクハウスにデータを移行するために CData のソリューションを使用していますが、ライブ接続ソリューションを使用して、データベースと Databricks 間の接続をフェデレートしているお客様も多数います。これらのお客様は、SQL Server リンクサーバーまたは Polybase を使用して、既存の RDBMS 内から Databricks へのライブアクセスを実現しています。

一般的な Databricks のユースケースと CData のソリューションがデータの問題解決にどのように役立つかについては、ブログをご覧ください:What is Databricks Used For? 6 Use Cases


はじめに


Google Sheets 向けに Databricks 接続を設定

Google Sheets から Databricks への接続は、Connect Spreadsheets を介して行います。Google Sheets でDatabricks のデータを操作するには、まず Databricks への接続を作成・設定します。

  1. Connect Spreadsheets にログインし、Connections をクリックして Add Connection をクリック
  2. Add Connection パネルから「Databricks」を選択
  3. Databricks に接続するために必要な認証プロパティを入力します。

    Databricks 接続プロパティの取得・設定方法

    Databricks クラスターに接続するには、以下のプロパティを設定します。

    • Database:Databricks データベース名。
    • Server:Databricks クラスターのサーバーのホスト名
    • HTTPPath:Databricks クラスターのHTTP パス。
    • Token:個人用アクセストークン。この値は、Databricks インスタンスのユーザー設定ページに移動してアクセストークンタブを選択することで取得できます。
    Databricks インスタンスで必要な値は、クラスターに移動して目的のクラスターを選択し、Advanced Options の下にあるJDBC/ODBC タブを選択することで見つけることができます。

    Databricks への認証

    CData は、次の認証スキームをサポートしています。

    • 個人用アクセストークン
    • Microsoft Entra ID(Azure AD)
    • Azure サービスプリンシパル
    • OAuthU2M
    • OAuthM2M

    個人用アクセストークン

    認証するには、次を設定します。

    • AuthSchemePersonalAccessToken
    • Token:Databricks サーバーへの接続に使用するトークン。Databricks インスタンスのユーザー設定ページに移動してアクセストークンタブを選択することで取得できます。

    その他の認証方法については、ヘルプドキュメント の「はじめに」セクションを参照してください。

  4. Create & Test をクリック

接続の設定が完了したら、Google Sheets からDatabricks のデータに接続する準備が整いました。

Google Sheets から Databricks ののデータにリアルタイムアクセス

以下の手順で、Google Sheets から Connect Spreadsheets に接続し、Databricks のデータにリアルタイムでアクセスします。

  1. Google Sheets にログインし、新しいシートを作成(または既存のシートを開きます)。
  2. 「拡張機能」をクリックし、「アドオンを取得」をクリック(すでにアドオンをインストール済みの場合は、手順5に進んでください)。
  3. Connect Spreadsheets Add-On を検索し、アドオンをインストールします。
  4. アドオンを承認します。
  5. Google Sheets に戻り、「拡張機能」をクリックして Connect Spreadsheets アドオンを開きます。
  6. アドオンパネルで「Log in」をクリックし、Connect Spreadsheets アカウントにサインイン・認証します。
  7. Google Sheets の Connect Spreadsheets パネルで Import をクリック
  8. Connection(例:Databricks1)、Table(例:Customers)、インポートする Columns を選択
  9. 必要に応じて Filters、Sorting、Limit を追加
  10. Execute をクリックしてデータをインポートし、既存のシートを上書きするか新しいシートを作成するかを選択します。

クラウドアプリから Databricks ののデータにリアルタイムアクセス

これで、Google Sheets ワークブックからDatabricks のデータへのクラウド間のダイレクト接続が確立されました。計算、集計、コラボレーションなど、さまざまな用途でワークブックにデータを追加できます。

Connect Spreadsheets を試して、クラウドアプリから直接 300 以上の SaaS、Big Data、NoSQL ソースにリアルタイムでアクセスしてみてください。

はじめる準備はできましたか?

Connect Spreadsheets の詳細、または無料トライアルにお申し込みください:

無料トライアル お問い合わせ