RapidMiner からGoogle Translate のデータに連携

古川えりか
古川えりか
コンテンツスペシャリスト
Google Translate をRapidMiner Studio の標準コンポーネント及びデータソース構成ウィザードと統合します。



この記事では、CData JDBC Driver for API をRapidMiner のプロセスと簡単に統合する方法を示します。この記事では、CData JDBC Driver for API を使用してGoogle Translate をRapidMiner のプロセスに転送します。

RapidMiner のGoogle Translate にJDBC Data Source として接続する

以下のステップに従ってGoogle Translate へのJDBC 接続を確認できます。

  1. Google Translate 用の新しいデータベースドライバーを追加します。[Connections]->[Manage Database Drivers]とクリックします。
  2. 表示されるウィザードで[Add]ボタンをクリックし、接続に名前を入力します。
  3. JDBC URL のプレフィックスを入力します。
    jdbc:api:
    
  4. インストールディレクトリのlib サブフォルダにあるcdata.jdbc.api.jar ファイルにパスを入力して下さい。
  5. ドライバークラスを入力します。
    cdata.jdbc.api.APIDriver
    
    The JDBC driver configuration.(Salesforce is shown.)
  6. 新しいGoogle Translate 接続を作成します。[Connections]->[Manage Database Connections]とクリックします。
  7. 接続の名前を入力します。
  8. データベースシステムの場合は、以前構成したGoogle Translate ドライバーを選択します。
  9. Host ボックスで接続文字列を入力します。

    認証

    Google Cloud Translation API では、翻訳サービス、データセット、用語集、適応型 MT リソースへの安全なアクセスを確保するために、OAuth 2.0 認証が必要です。この認証方式により、Google Cloud プロジェクトに安全に接続し、適切な認可のもとで翻訳リソースを管理できます。

    OAuth 2.0 のセットアップと設定

    ステップ 1:Google Cloud プロジェクトの作成と API の有効化

    OAuth 認証をセットアップするには、以下のステップで進めます:

    1. Google Cloud Console にアクセスします
    2. 新しいプロジェクトを作成するか、既存のプロジェクトを選択します
    3. Project ID を控えておきます(すべての API 呼び出しで必要です)
    4. 「APIs & Services」 > 「Library」に移動します
    5. 「Cloud Translation API」を検索して有効化します
    6. 「APIs & Services」 > 「Credentials」に移動します
    7. 「Create Credentials」をクリックし、「OAuth Client ID」を選択します
    8. プロンプトが表示されたら OAuth 同意画面を設定します
    9. 用途に応じて「Desktop application」または「Web application」を選択します
    10. 承認済みリダイレクト URI(CallbackURL)を設定します
    11. 接続で使用する Client ID と Client Secret をコピーします

    必須の接続プロパティ

    • AuthScheme:OAuth に設定します(必須)
    • OAuthClientId:Google Cloud Console の Client ID(必須)
    • OAuthClientSecret:Google Cloud Console の Client Secret(必須)
    • CallbackURL:OAuth アプリケーションで指定したリダイレクト URI(必須)
    • InitiateOAuth:トークンを自動管理するには GETANDREFRESH に設定します(推奨)
    • ProjectId:Google Cloud のプロジェクト ID またはプロジェクト番号(クエリに必須)

    必須の OAuth スコープ

    Google Cloud Translation API プロファイルでは、以下の OAuth スコープが必要です:

    • https://www.googleapis.com/auth/cloud-translation - 翻訳、データセット、用語集、適応型 MT を含む Cloud Translation API リソースへのフルアクセス

    ビルトイン接続文字列デザイナ

    JDBC URL の構成については、Google Translate JDBC Driver に組み込まれている接続文字列デザイナを使用してください。JAR ファイルのダブルクリック、またはコマンドラインからJAR ファイルを実行します。

    java -jar cdata.jdbc.api.jar
    

    接続プロパティを入力し、接続文字列をクリップボードにコピーします。

    Using the built-in connection string designer to generate a JDBC URL (Salesforce is shown.)

    以下は一般的な接続文字列です。

    Profile=C:\profiles\GoogleTranslate.apip;AuthScheme=OAuth;InitiateOAuth=GETANDREFRESH;OAuthClientId=your_client_id;OAuthClientSecret=your_client_secret;CallbackUrl=your_callback_url;
    
  10. 必要であればユーザー名とパスワードを入力します。 The connection to the JDBC data source.(Salesforce is shown.)

プロセス内の様々なRapidMiner オペレーターとのGoogle Translate 接続を使用できます。Google Translate を取得するには、[Operators]ビューから[Retrieve]をドラッグします。 A Retrieve operation to select data.(Salesforce is shown.) [Retrieve]オペレータを選択した状態で、[repository entry]の横にあるフォルダアイコンをクリックして[Parameters]ビューで取得するテーブルを定義できます。表示されるRepository ブラウザで接続ノードを展開し、目的のサンプルセットを選択できます。

The Repository Browser window you can use to select an example set.(Salesforce is shown.)

最後に、[Retrieve]プロセスから結果に出力をワイヤリングし、プロセスを実行してGoogle Translate を確認します。

The results of the Retrieve operation.(Salesforce is shown.)

はじめる準備はできましたか?

API Driver で Google Translate のライブデータに接続

Google Translate に接続