Python で pandas を使って PhantomBuster データを可視化する方法

Jerod Johnson
Jerod Johnson
Director, Technology Evangelism
pandas などのモジュールを使って Python で PhantomBuster のデータをリアルタイムに分析・可視化する方法を紹介します。



Python の豊富なエコシステムを活用することで、作業を迅速に開始し、システム間の連携をより効果的に行うことができます。CData API Driver for Python、pandas および Matplotlib モジュール、SQLAlchemy ツールキットを組み合わせることで、PhantomBuster に接続した Python アプリケーションやスクリプトを構築し、PhantomBuster のデータを可視化できます。この記事では、pandas、SQLAlchemy、Matplotlib の組み込み関数を使用して PhantomBuster のデータに接続し、クエリを実行して結果を可視化する方法を説明します。

CData Python Connector は、組み込みの最適化されたデータ処理機能により、Python での PhantomBuster のデータへのリアルタイムアクセスにおいて比類のないパフォーマンスを提供します。PhantomBuster に対して複雑な SQL クエリを発行すると、ドライバーはフィルタや集計などのサポートされている SQL 操作を PhantomBuster に直接プッシュし、サポートされていない操作(多くの場合、SQL 関数や JOIN 操作)は組み込みの SQL エンジンを使用してクライアント側で処理します。

PhantomBuster のデータへの接続

PhantomBuster のデータへの接続は、他のリレーショナルデータソースへの接続と同様です。必要な接続プロパティを使用して接続文字列を作成します。この記事では、接続文字列を create_engine 関数のパラメータとして渡します。

API キー認証の設定

Phantombuster API を利用するには、Phantombuster のアカウント設定から API キーを取得する必要があります。phantombuster.com に移動し、プロフィールアイコンをクリックして Settings を選択し、API セクションから API キーをコピーしてください。

以下の接続プロパティを設定して接続を確立してください:

  • AuthScheme:APIKey に設定します。
  • APIKey:アカウント設定ページから取得した Phantombuster の API キーに設定します。

複数組織のアカウント

API キーが複数の組織に紐づいている場合は、OrganizationId 接続プロパティに対象の組織識別子を設定することで、特定の組織を指定できます。設定すると、X-Phantombuster-Org リクエストヘッダーとして送信されます。

接続文字列の例:

Profile=C:\profiles\Phantombuster.apip;AuthScheme=APIKey;ProfileSettings="APIKey=your_api_key_here"

以下の手順に従って、必要なモジュールをインストールし、Python オブジェクトを介して PhantomBuster にアクセスしてみましょう。

必要なモジュールのインストール

pip ユーティリティを使用して、pandas、Matplotlib モジュール、および SQLAlchemy ツールキットをインストールします。

pip install pandas
pip install matplotlib
pip install sqlalchemy

以下のようにモジュールをインポートしてください。

import pandas
import matplotlib.pyplot as plt
from sqlalchemy import create_engine

Python で PhantomBuster のデータを可視化する

接続文字列を使用して接続できます。create_engine 関数を使用して、PhantomBuster のデータを操作するための Engine を作成します。

engine = create_engine("api:///?Profile=C:\profiles\Phantombuster.apip&AuthScheme=APIKey&ProfileSettings="APIKey=your_api_key_here"")

PhantomBuster への SQL の実行

pandas の read_sql 関数を使用して、SQL ステートメントを実行し、結果セットを DataFrame に格納します。

df = pandas.read_sql("SELECT ,  FROM Agents WHERE  = ''", engine)

PhantomBuster のデータの可視化

クエリ結果が DataFrame に格納されたら、plot 関数を使用して PhantomBuster のデータを表示するグラフを作成します。show メソッドで、グラフを新しいウィンドウに表示します。

df.plot(kind="bar", x="", y="")
plt.show()

無料トライアル & 詳細情報

CData API Driver for Python の 30日間無料トライアルをダウンロードして、PhantomBuster のデータに接続する Python アプリケーションやスクリプトの構築を始めましょう。ご質問がありましたら、サポートチームまでお気軽にお問い合わせください。



完全なソースコード

import pandas
import matplotlib.pyplot as plt
from sqlalchemy import create_engin

engine = create_engine("api:///?Profile=C:\profiles\Phantombuster.apip&AuthScheme=APIKey&ProfileSettings="APIKey=your_api_key_here"")
df = pandas.read_sql("SELECT ,  FROM Agents WHERE  = ''", engine)

df.plot(kind="bar", x="", y="")
plt.show()

はじめる準備はできましたか?

API Driver で PhantomBuster のライブデータに接続

PhantomBuster に接続