CloverDX(旧CloverETL)で ScrapingBee のデータ に接続

Jerod Johnson
Jerod Johnson
Director, Technology Evangelism
CloverDX データ統合ツールのビジュアルワークフローを使って ScrapingBee のデータ を転送。



CData JDBC Driver for ScrapingBee を使用すると、CloverDX(旧CloverETL)のデータ変換コンポーネントで ScrapingBee をソースとして扱えます。この記事では、JDBC Driver for ScrapingBee を使用して、フラットファイルへのシンプルな転送を設定する方法を説明します。

JDBC データソースとして ScrapingBee に接続

  1. ScrapingBee のデータ への接続を作成します。新規のCloverDX グラフで、Outline ペインの「Connections」ノードを右クリックし、「Connections」->「Create Connection」をクリックします。Database Connection ウィザードが表示されます。
  2. プラスアイコンをクリックし、JAR からドライバーをロードします。インストールディレクトリのlib サブフォルダを参照し、cdata.jdbc.api.jar ファイルを選択します。
  3. JDBC URL を入力します。

    API キー認証の設定

    ScrapingBee は API キー認証を使用します。API キーを取得するには、以下のステップで進めます:

    1. https://app.scrapingbee.com で ScrapingBee アカウントにサインインします
    2. Dashboard に移動して、上部のセクションで API キーを確認します。
    3. 接続文字列で使用する API キーをコピーします。

    API キーを取得したら、以下の接続プロパティを設定します:

    • AuthScheme:APIKey に設定します。
    ProfileSettings 接続プロパティには以下を設定します:
    • APIKey:ScrapingBee の API キーに設定します。

    接続文字列の例

    Profile=C:\profiles\ScrapingBee.apip;AuthScheme=APIKey;ProfileSettings="APIKey=your_api_key";
    

    ScrapingBee への接続

    認証を設定すると、ScrapingBee に接続して、利用可能なテーブルからデータをクエリできます。すべてのテーブルでは、データを取得するために少なくとも 1 つの入力パラメータ(検索クエリや商品 ID など)が必要です。

    組み込みの接続文字列デザイナー

    JDBC URL の構築には、ScrapingBee JDBC Driver に組み込まれている接続文字列デザイナーを使用してください。JAR ファイルをダブルクリックするか、コマンドラインから実行します。

    java -jar cdata.jdbc.api.jar
    

    接続プロパティを入力し、接続文字列をクリップボードにコピーします。

    一般的なJDBC URL は次のようになります:

    jdbc:api:Profile=C:\profiles\ScrapingBee.apip;AuthScheme=APIKey;ProfileSettings="APIKey=your_api_key";

DBInputTable コンポーネントで ScrapingBee のデータ をクエリ

  1. Palette の「Readers」から「DBInputTable」をジョブフローにドラッグし、ダブルクリックして設定エディターを開きます。
  2. 「DB connection」プロパティで、ドロップダウンメニューから ScrapingBee JDBC データソースを選択します。
  3. SQL クエリを入力します。例:
    SELECT ,  FROM GoogleSearchResults WHERE SearchQuery = 'cdata drivers'

クエリの出力をUniversalDataWriter に書き込む

  1. 「Writers」から「UniversalDataWriter」をジョブフローにドラッグします。
  2. UniversalDataWriter をダブルクリックして設定エディターを開き、ファイルURL を追加します。
  3. DBInputTable を右クリックし、「Extract Metadata」をクリックします。
  4. DBInputTable の出力ポートをUniversalDataWriter に接続します。
  5. UniversalDataWriter の「Select Metadata」メニューで、GoogleSearchResults テーブルを選択します。(このメニューはUniversalDataWriter の入力ポートを右クリックしても開けます。)
  6. 「Run」をクリックして、ファイルに書き込みます。

はじめる準備はできましたか?

API Driver で ScrapingBee のライブデータに接続

ScrapingBee に接続