Exploratory でScrapingBee のデータを連携する方法

桑島義行
桑島義行
テクニカルディレクター
ODBC 接続でExploratory からScrapingBee のデータにSQL でクエリ



CData ODBC Driver for API は、ODBC 経由でリアルタイムScrapingBee データに標準SQL での利用を可能にします。 ここでは、汎用ODBC データプロバイダーとしてScrapingBee に接続し、データアナリティクスツールのExploratory (https://exploratory.io/) からScrapingBee のデータを連携利用する手順を説明します。
Exploratory は、多くのRDB やRedshift、BigQuery などのクラウドデータストアに対応していますが、SaaS データを分析したい場合にはCData ODBC ドライバを使うことで、API コーディング不要でデータを活用できます。今回はScrapingBee を例に説明します。

CData ODBC ドライバとは?

CData ODBC ドライバは、以下のような特徴を持ったリアルタイムデータ連携ソリューションです。

  1. ScrapingBee をはじめとする、CRM、MA、会計ツールなど多様なカテゴリの270種類以上のSaaS / オンプレミスデータソースに対応
  2. 多様なアプリケーション、ツールにScrapingBee のデータを連携
  3. ノーコードでの手軽な接続設定
  4. 標準 SQL での柔軟なデータ読み込み・書き込み

CData ODBC ドライバでは、1.データソースとしてScrapingBee の接続を設定、2.Exploratory 側でODBC Driver との接続を設定、という2つのステップだけでデータソースに接続できます。以下に具体的な設定手順を説明します。

CData ODBC ドライバのインストールとScrapingBee への接続設定

まずは、本記事右側のサイドバーからAPI ODBC Driver の無償トライアルをダウンロード・インストールしてください。30日間無償で、製品版の全機能が使用できます。

次にマシンにScrapingBee のデータ に接続するODBC DSN を設定します。Exploratory からはそのODBC DSN を参照する形になります。ODBC DSN 設定の詳細については、ドキュメントを参照してください。

API キー認証の設定

ScrapingBee は API キー認証を使用します。API キーを取得するには、以下のステップで進めます:

  1. https://app.scrapingbee.com で ScrapingBee アカウントにサインインします
  2. Dashboard に移動して、上部のセクションで API キーを確認します。
  3. 接続文字列で使用する API キーをコピーします。

API キーを取得したら、以下の接続プロパティを設定します:

  • AuthScheme:APIKey に設定します。
ProfileSettings 接続プロパティには以下を設定します:
  • APIKey:ScrapingBee の API キーに設定します。

接続文字列の例

Profile=C:\profiles\ScrapingBee.apip;AuthScheme=APIKey;ProfileSettings="APIKey=your_api_key";

ScrapingBee への接続

認証を設定すると、ScrapingBee に接続して、利用可能なテーブルからデータをクエリできます。すべてのテーブルでは、データを取得するために少なくとも 1 つの入力パラメータ(検索クエリや商品 ID など)が必要です。

Exploratory 上でScrapingBee のデータをセット

  • Exploratory で[コネクション]をクリックして新しいコネクションを作成します。
  • [追加]→[ODBC]の順にクリック。
  • コネクション追加画面で先ほど設定したScrapingBee ODBC のDSN を設定します。
    名前:任意
    タイプ:ODBC
    DSN:上の設定したDSN 名(CData ScrapingBee Sys)
  • Adding new connection
  • コネクションテストを下の地、[追加]を押して接続を確定させます。

Exploratory でScrapingBee のデータをクエリし、データフレームとして保存

さあ、Exploratory からScrapingBee のデータを扱ってみましょう。

  • Exploratory でプロジェクトを[新規作成]します。
  • [データフレーム]の[+]印をクリックし、[データベースデータ]を選択します。
  • Create new Dataframe
  • データベースは[ODBC]をクリック。
  • Select ODBC
  • [コネクション]で先ほど設定したScrapingBee のコネクションを選択します。
  • RDB ソースの感覚でSELECT クエリでScrapingBee のデータをクエリします。標準SQL でフィルタリング、ソート、JOIN も可能です。
  • Query data using standard SQL
  • データセットをデータフレームとして保存します。

Exploratory でのScrapingBee のデータの分析

データフレームになったデータは通常のRDB データソースと同じようにExploratory で利用可能です。

Query data using standard SQL

おわりに

このようにCData ODBC ドライバと併用することで、270を超えるSaaS、NoSQL データをコーディングなしで扱うことができます。30日の無償評価版が利用できますので、ぜひ自社で使っているクラウドサービスやNoSQL と合わせて活用してみてください。

CData ODBC ドライバは日本のユーザー向けに、UI の日本語化、ドキュメントの日本語化、日本語でのテクニカルサポートを提供しています。

はじめる準備はできましたか?

API Driver で ScrapingBee のライブデータに接続

ScrapingBee に接続