Mule アプリケーションからScrapingBee のデータにアクセス:CData JDBC Driver

古川えりか
古川えりか
コンテンツスペシャリスト
CData JDBC ドライバとHTTP、SQL を組み合わせれば、ScrapingBee のデータのJSON エンドポイントに接続できるMule アプリケーションを簡単に作成できます。



CData JDBC Driver for API はScrapingBee のデータをMule アプリケーションと連携することで、読みといった機能をおなじみのSQL クエリを使って実現します。JDBC ドライバーを使えば、ScrapingBee のデータをバックアップ、変換、レポート作成、分析するMule アプリケーションをユーザーは簡単に作成できます。

本記事では、Mule プロジェクト内でCData JDBC Driver for API を使用して、ScrapingBee のデータのWeb インターフェースを作成する方法を紹介します。作成したアプリケーションを使えば、HTTP 経由でScrapingBee のデータをリクエストして、JSON 形式で結果を取得できます。まったく同様の手順で、すべてのCData JDBC ドライバで数百種類のデータソースのWeb インターフェースを作成できます。手順は以下のとおりです。

  1. Anypoint Studio で新しいMule プロジェクトを作る。
  2. Message Flow にHTTP コネクタを追加する。
  3. HTTP コネクタのアドレスを設定する。 HTTP コネクタを追加・設定
  4. HTTP コネクタの追加後、Database Select コネクタを同じフローに追加する。
  5. データベースへの新しい接続を作成し(または既存の接続を編集し)、プロパティを設定する。
    • 接続を「Generic Connection」に設定
    • Required Libraries セクションでCData JDBC ドライバのJAR ファイルを指定する(例:cdata.jdbc.api.jar)。 JAR ファイルを追加(Salesforce の場合)。
    • ScrapingBee の接続文字列にURL を指定

      API キー認証の設定

      ScrapingBee は API キー認証を使用します。API キーを取得するには、以下のステップで進めます:

      1. https://app.scrapingbee.com で ScrapingBee アカウントにサインインします
      2. Dashboard に移動して、上部のセクションで API キーを確認します。
      3. 接続文字列で使用する API キーをコピーします。

      API キーを取得したら、以下の接続プロパティを設定します:

      • AuthScheme:APIKey に設定します。
      ProfileSettings 接続プロパティには以下を設定します:
      • APIKey:ScrapingBee の API キーに設定します。

      接続文字列の例

      Profile=C:\profiles\ScrapingBee.apip;AuthScheme=APIKey;ProfileSettings="APIKey=your_api_key";
      

      ScrapingBee への接続

      認証を設定すると、ScrapingBee に接続して、利用可能なテーブルからデータをクエリできます。すべてのテーブルでは、データを取得するために少なくとも 1 つの入力パラメータ(検索クエリや商品 ID など)が必要です。

      組み込みの接続文字列デザイナ

      JDBC 用のURL の作成にサポートが必要な場合は、ScrapingBee JDBC Driver に組み込まれた接続文字列デザイナを使用できます。JAR ファイルをダブルクリックするか、コマンドラインからJAR ファイルを実行してください。

      		java -jar cdata.jdbc.api.jar
      		

      接続プロパティを入力して、接続文字列をクリップボードにコピーします。

    • Driver クラス名をcdata.jdbc.api.APIDriver に指定します。 設定したデータベース接続(Salesforce の場合)。
    • 「接続テスト」をクリックします。
  6. SQL Query Text をScrapingBee のデータをリクエストするためのSQL クエリに設定します。例えば、
    SELECT ,  FROM GoogleSearchResults WHERE SearchQuery = 'cdata drivers'
    Select オブジェクトを設定(Salesforce の場合)
  7. Transform Message コンポーネントをフローに追加します。
  8. Output スクリプトを次のように設定して、ペイロードをJSON に変換します。
    %dw 2.0
    output application/json
    ---
    payload
            
    Transform Message コンポーネントをフローに追加
  9. ScrapingBee のデータを閲覧するには、HTTP コネクタ用に設定したアドレスに移動します(デフォルトでは、localhost:8081):http://localhost:8081。Web ブラウザおよびJSON エンドポイントを使用可能な他のツール内で、ScrapingBee のデータをJSON として利用できます。

これで、カスタムアプリケーションおよび他のさまざまなBI、帳票、ETL ツールからScrapingBee のデータを(JSON データとして)扱うための簡易なWeb インターフェースを作成できました。Mule アプリケーションからお好みのデータソースにアクセスできる、JDBC Driver for API の30日の無償評価版のダウンロードはこちらから。

はじめる準備はできましたか?

API Driver で ScrapingBee のライブデータに接続

ScrapingBee に接続