JayDeBeApi を使って Python からScrapingBee のデータにアクセス

Jerod Johnson
Jerod Johnson
Director, Technology Evangelism
Python スクリプトを使用して、ScrapingBee のデータ にリアルタイムでアクセス。JayDeBeApi モジュールと CData JDBC Driver でScrapingBee のデータを操作できます。

Python と Java がインストールされている環境であれば、Python スクリプトと標準 SQL を使ってScrapingBee のデータにアクセスできます。CData API Driver for JDBC と JayDeBeApi モジュールを組み合わせることで、Python からリモートのScrapingBee のデータを操作できます。CData ドライバーを使用することで、業界標準に準拠した実績のあるドライバーを Python という人気の高い言語で活用できます。この記事では、ドライバーを使って ScrapingBee に SQL クエリを実行し、標準的な Python でScrapingBee のデータを可視化する方法を説明します。

JayDeBeApi モジュールを使用

JayDeBeApi は、JDBC(Java Database Connectivity)のブリッジとして機能する Python ライブラリで、Python プログラムから CData JDBC ドライバーを含む Java データベースとやり取りできるようになります。pip install コマンドでモジュールをインストールします。

pip install JayDeBeApi

JDBC URL を作成

JayDeBeApi をインストールしたら、SQL を使って Python からScrapingBee のデータを操作する準備が整います。

API キー認証の設定

ScrapingBee は API キー認証を使用します。API キーを取得するには、以下のステップで進めます:

  1. https://app.scrapingbee.com で ScrapingBee アカウントにサインインします
  2. Dashboard に移動して、上部のセクションで API キーを確認します。
  3. 接続文字列で使用する API キーをコピーします。

API キーを取得したら、以下の接続プロパティを設定します:

  • AuthScheme:APIKey に設定します。
ProfileSettings 接続プロパティには以下を設定します:
  • APIKey:ScrapingBee の API キーに設定します。

接続文字列の例

Profile=C:\profiles\ScrapingBee.apip;AuthScheme=APIKey;ProfileSettings="APIKey=your_api_key";

ScrapingBee への接続

認証を設定すると、ScrapingBee に接続して、利用可能なテーブルからデータをクエリできます。すべてのテーブルでは、データを取得するために少なくとも 1 つの入力パラメータ(検索クエリや商品 ID など)が必要です。

ビルトイン接続文字列デザイナー

JDBC URL の作成には、ScrapingBee JDBC Driver に組み込まれている接続文字列デザイナーを使用してください。JAR ファイルをダブルクリックするか、コマンドラインから実行します。

java -jar cdata.jdbc.api.jar

接続プロパティを入力し、接続文字列をクリップボードにコピーします。

以下は、一般的な JDBC 接続文字列を含む変数の例です。

jdbc_url = "jdbc:api:Profile=C:\profiles\ScrapingBee.apip;AuthScheme=APIKey;ProfileSettings="APIKey=your_api_key";"

Python からScrapingBee のデータにアクセス

JDBC URL を設定したら、あとは JDBC ドライバーの JAR ファイルへの絶対パスだけが必要です。これはインストールディレクトリの "lib" フォルダにあります(Windows では "C:\Program Files\CData[product_name] 20XX\lib\cdata.jdbc.api.jar")。

注意: まだ設定していない場合は、JAVA_HOME 環境変数を Java のインストールディレクトリに設定してください。

以下のようなコードで ScrapingBee からデータを読み取り、表示できます。

import jaydebeapi

#The JDBC connection string
jdbc_url = "jdbc:api:Profile=C:\profiles\ScrapingBee.apip;AuthScheme=APIKey;ProfileSettings="APIKey=your_api_key";"

username = "****"
password = "****"

#The absolute Path to the JDBC driver JAR file, typically:
jdbc_driver_jar = "C:\Program Files\CData[product_name] 20XX\lib\cdata.jdbc.api.jar"

conn = jaydebeapi.connect(
   "cdata.jdbc.api.APIDriver",
   jdbc_url,
   [username, password],
   jdbc_driver_jar,
)

cursor = conn.cursor()
cursor.execute("SELECT * FROM GoogleSearchResults;")


results = cursor.fetchall()
for row in results:
    print(row)

cursor.close()
conn.close()

無料トライアルと詳細情報

CData API Driver for JDBC の 30 日間無料トライアルをダウンロードして、Python でリアルタイムのScrapingBee のデータを操作してみてください。ご不明な点がございましたら、サポートチームまでお問い合わせください。

はじめる準備はできましたか?

API Driver で ScrapingBee のライブデータに接続

ScrapingBee に接続