Informatica Cloud で Scrapfly のデータ を連携

Jerod Johnson
Jerod Johnson
Director, Technology Evangelism
CData JDBC ドライバーと Informatica Cloud Secure Agent を使用して、Informatica Cloud から Scrapfly のデータ にリアルタイム接続。

Informatica Cloud は、クラウド上で抽出、変換、ロード(ETL)タスクを実行できるツールです。Cloud Secure Agent と CData API Driver for JDBC を組み合わせることで、Informatica Cloud から直接 Scrapfly のデータ にリアルタイムでアクセスできます。本記事では、Cloud Secure Agent のダウンロードと登録、JDBC ドライバーを介した Scrapfly への接続、そして Informatica Cloud のプロセスで使用可能なマッピングの作成方法をご紹介します。

Informatica Cloud Secure Agent

JDBC ドライバー経由で Scrapfly のデータ に接続するには、Cloud Secure Agent をインストールします。

  1. Informatica Cloud の Administrator ページに移動します
  2. Runtime Environments タブを選択します
  3. 「Download Secure Agent」をクリックします
  4. Install Token をメモしておきます
  5. クライアントマシンでインストーラを実行し、ユーザー名と Install Token を使って Cloud Secure Agent を登録します

NOTE: Cloud Secure Agent のすべてのサービスが起動するまでに、しばらく時間がかかる場合があります。

Scrapfly JDBC Driver への接続

Cloud Secure Agent のインストールと起動が完了したら、JDBC ドライバーを介して Scrapfly に接続する準備が整いました。

Secure Agent マシンへの JDBC ドライバーの追加

  1. Secure Agent マシンの以下のディレクトリに移動します:
    %Secure Agent installation directory%/ext/connectors/thirdparty/
  2. 設定するマッピングの種類に応じて、フォルダを作成しドライバーの JAR ファイル(cdata.jdbc.api.jar)を追加します。

    マッピングの場合は、以下のフォルダを作成してドライバーの JAR ファイルを追加します:

    informatica.jdbc_v2/common

    アドバンスドモードのマッピングの場合は、以下のフォルダも作成してドライバーの JAR ファイルを追加します:

    informatica.jdbc_v2/spark
  3. Secure Agent を再起動します。

Informatica Cloud での Scrapfly への接続

ドライバーの JAR ファイルをインストールしたら、Informatica Cloud で Scrapfly への接続を設定します。Connections タブをクリックし、New Connection をクリックして、以下のプロパティを入力します:
  • Connection Name: 接続に名前を付けます(例:CData Scrapfly Connection)
  • Type:「JDBC_V2」を選択します
  • Runtime Environment: Secure Agent をインストールしたランタイム環境を選択します
  • JDBC Driver Class Name: JDBC ドライバークラス名を入力します:cdata.jdbc.api.APIDriver
  • JDBC Connection URL: Scrapfly の JDBC URL を設定します。URL は以下のようになります:

    jdbc:api:Profile=C:\profiles\Scrapfly.apip;AuthScheme=APIKey;ProfileSettings='APIKey=your_api_key';

    Scrapfly API は API キー認証を使用します。API キーは、すべてのリクエストで key クエリパラメータとして渡されます。

    API キー認証の設定

    接続を作成するには、Scrapfly の API キーが必要です。API キーを取得するには、以下のステップで進めます:

    1. scrapfly.io で Scrapfly アカウントにログインします。
    2. Dashboard に移動して API Keys を選択します。
    3. API キーをコピーします(本番環境用は scp-live-、テスト環境用は scp-test- で始まります)。

    API キーを取得したら、以下の接続プロパティを設定します:

    • AuthScheme:APIKey に設定します。
    • APIKey:Scrapfly の API キーに設定します。

    接続文字列の例:

    Profile=C:\profiles\Scrapfly.apip;AuthScheme=APIKey;ProfileSettings='APIKey=your_api_key';
    

    組み込みの接続文字列デザイナー

    JDBC URL の作成には、Scrapfly JDBC Driver に組み込まれている接続文字列デザイナーを使用できます。.jar ファイルをダブルクリックするか、コマンドラインから実行してください。

        java -jar cdata.jdbc.api.jar
        

    接続プロパティを入力し、接続文字列をクリップボードにコピーします。

  • Username: プレースホルダー値を設定します(Scrapfly はユーザー名を必要としないため)
  • Password: プレースホルダー値を設定します(Scrapfly はパスワードを必要としないため)

Scrapfly のデータ のマッピングを作成

Scrapfly への接続を設定したら、Informatica の任意のプロセスで Scrapfly のデータ にアクセスできます。以下の手順では、Scrapfly から別のデータターゲットへのマッピングを作成する方法を説明します。

  1. Data Integration ページに移動します
  2. New.. をクリックし、Mappings タブから Mapping を選択します
  3. Source Object をクリックし、Source タブで Connection を選択し、Source Type を設定します
  4. 「Select」をクリックして、マッピングするテーブルを選択します
  5. Fields タブで、マッピングする Scrapfly テーブルのフィールドを選択します
  6. Target オブジェクトをクリックし、Target ソース、テーブル、フィールドを設定します。Field Mapping タブで、ソースフィールドをターゲットフィールドにマッピングします。

マッピングの設定が完了すると、Informatica Cloud でサポートされている任意の接続先と Scrapfly のデータ のリアルタイム連携を開始できます。CData API Driver for JDBC の30日間無償トライアルをダウンロードして、Informatica Cloud で Scrapfly のデータ の活用を今すぐ始めましょう。

はじめる準備はできましたか?

API Driver で Scrapfly のライブデータに接続

Scrapfly に接続