Informatica Enterprise Data Catalog で Google Translate のデータを追加

Jerod Johnson
Director, Technology Evangelism

CData JDBC Driver for Google Translate を Informatica Enterprise Data Catalog で使用し、データを分類・整理します。

Informatica は、データの転送と変換を行うための強力で洗練された手段を提供します。CData JDBC Driver for Google Translate を使用すると、業界標準に準拠したドライバーを通じて Informatica Enterprise Data Catalog とシームレスに連携できます。このチュートリアルでは、あらゆる環境で Google Translate データを分類・整理する方法を説明します。

JDBC ドライバーのロード

JDBC ドライバーをロードするには：

Informatica が動作しているホストに JDBC ドライバーをインストールします。この記事では、ドライバーが cdata.jdbc.api.APIDriver にインストールされていることを前提としています。

$ java -jar setup.jar

JDBC インストールディレクトリに移動し、ドライバーとそのライセンスファイルを含む genericJDBC.zip という名前の zip ファイルを作成します。

$ cd ~/cdata-jdbc-driver-for-api/lib
$ zip genericJDBC.zip cdata.jdbc.api.jar cdata.jdbc.api.lic

genericJDBC.zip ファイルを Informatica 内の Catalog Service ディレクトリに移動します。この記事では、Informatica が /opt/informatica にインストールされていることを前提としています。このフォルダでの作業には、おそらく root 権限が必要です。続行する前に、su または sudo で root に切り替えてください。

# mv genericJDBC.zip /opt/informatica/services/CatalogService/ScannerBinaries

zip ファイルを展開するために、カスタムデプロイメント設定を編集します。

# cd /opt/informatica/services/CatalogService/ScannerBinaries/CustomDeployer/
# nano scannerDeployer.xml

既存の ExecutionContextProperty ノードを展開した後、以下の内容で新しい ExecutionContextProperty ノードを追加します。


<ExecutionContextProperty
    isLocationProperty="true"
    dependencyToUnpack="genericJDBC.zip">
<PropertyName>JDBCScanner_DriverLocation</PropertyName>
<PropertyValue>scanner_miti/genericJDBC/Drivers</PropertyValue>
</ExecutionContextProperty>

Admin コンソールから Catalog Service をリフレッシュします。

Admin コンソールから Catalog Service をリフレッシュします。

JDBC リソースの設定

JDBC リソースを設定するには：

Catalog 管理画面を開き、以下のプロパティで新しい JDBC リソースを追加します：

Driver Class: cdata.jdbc.api.APIDriver
URL: jdbc.api:Profile=C:\profiles\GoogleTranslate.apip;AuthScheme=OAuth;InitiateOAuth=GETANDREFRESH;OAuthClientId=your_client_id;OAuthClientSecret=your_client_secret;CallbackUrl=your_callback_url;

認証

Google Cloud Translation API では、翻訳サービス、データセット、用語集、適応型 MT リソースへの安全なアクセスを確保するために、OAuth 2.0 認証が必要です。この認証方式により、Google Cloud プロジェクトに安全に接続し、適切な認可のもとで翻訳リソースを管理できます。

OAuth 2.0 のセットアップと設定

ステップ 1：Google Cloud プロジェクトの作成と API の有効化

OAuth 認証をセットアップするには、以下のステップで進めます：

Google Cloud Console にアクセスします
新しいプロジェクトを作成するか、既存のプロジェクトを選択します
Project ID を控えておきます（すべての API 呼び出しで必要です）
「APIs & Services」 > 「Library」に移動します
「Cloud Translation API」を検索して有効化します
「APIs & Services」 > 「Credentials」に移動します
「Create Credentials」をクリックし、「OAuth Client ID」を選択します
プロンプトが表示されたら OAuth 同意画面を設定します
用途に応じて「Desktop application」または「Web application」を選択します
承認済みリダイレクト URI（CallbackURL）を設定します
接続で使用する Client ID と Client Secret をコピーします

必須の接続プロパティ

AuthScheme：OAuth に設定します（必須）
OAuthClientId：Google Cloud Console の Client ID（必須）
OAuthClientSecret：Google Cloud Console の Client Secret（必須）
CallbackURL：OAuth アプリケーションで指定したリダイレクト URI（必須）
InitiateOAuth：トークンを自動管理するには GETANDREFRESH に設定します（推奨）
ProjectId：Google Cloud のプロジェクト ID またはプロジェクト番号（クエリに必須）

必須の OAuth スコープ

Google Cloud Translation API プロファイルでは、以下の OAuth スコープが必要です：

https://www.googleapis.com/auth/cloud-translation - 翻訳、データセット、用語集、適応型 MT を含む Cloud Translation API リソースへのフルアクセス

組み込みの接続文字列デザイナー

JDBC URL の構築については、Google Translate JDBC Driver に組み込まれている接続文字列デザイナーを使用してください。.jar ファイルをダブルクリックするか、コマンドラインから .jar ファイルを実行します。

java -jar cdata.jdbc.api.jar

接続プロパティを入力し、接続文字列をクリップボードにコピーします。

組み込みの接続文字列デザイナーを使用して JDBC URL を生成（Salesforce の例）

JDBC URL を設定する際に、Max Rows 接続プロパティも設定することをお勧めします。これにより返される行数が制限され、レポートやビジュアライゼーションの設計時にパフォーマンスを向上させることができます。

一般的な追加の接続文字列プロパティは以下のとおりです：

JDBC;MSTR_JDBC_JAR_FOLDER=PATH\TO\JAR\;DRIVER=cdata.jdbc.api.APIDriver;URL={jdbc:api:Profile=C:\profiles\GoogleTranslate.apip;AuthScheme=OAuth;InitiateOAuth=GETANDREFRESH;OAuthClientId=your_client_id;OAuthClientSecret=your_client_secret;CallbackUrl=your_callback_url;};

Username: user
Password: password

Username と Password プロパティは、使用するドライバーが必要としない場合でも必須です。その場合は、代わりにプレースホルダー値を入力してください。

少なくとも1つのソースメタデータスキャンを実行するために、メタデータオプションを設定します。このスキャンでは、ドライバーを使用してサービス経由で利用可能なテーブル、ビュー、ストアドプロシージャを特定します。

Source Metadata: このオプションを有効にします。
Catalog: マルチカタログのデータソースの場合は、適切なカタログに設定します。それ以外の場合は、CData に設定します。
Schema: マルチスキーマのデータソースの場合は、適切なスキーマに設定します。それ以外の場合は、サービス名（例：Couchbase）に設定します。
Case-sensitivity: 通常、このオプションは無効にしてください。大文字と小文字を区別するデータソースの場合のみ有効にします。
Import stored procedures: テーブルやビューに加えてストアドプロシージャの定義もインポートしたい場合は、これを有効にします。

必要に応じて、他のメタデータスキャナーも有効にできます。

ドライバーの設定を完了し、オプションでカスタム属性とスキャナースケジュールを設定します。
Monitoring タブに移動し、Run をクリックしてメタデータスキャンを実行します。データソースによっては、数分かかる場合があります。

スキャンが完了すると、すべてのメタデータオブジェクトの概要と Metadata Load ジョブのステータスが表示されます。エラーが発生した場合は、ジョブの Log Location リンクを開いて、Informatica またはドライバーが報告したエラーを確認できます。

検出されたメタデータの確認

Catalog Service ブラウザを開いて、データソースから抽出されたメタデータを表示します。メタデータスキャナーの設定時に選択したオプションに応じて、定義したリソースのテーブル、ビュー、ストアドプロシージャの任意の組み合わせが表示されます。

はじめる準備はできましたか？

API Driver で Google Translate のライブデータに接続

Google Translate に接続

CData は、AI を本番環境で機能させるデータレイヤーです。数百の主要エンタープライズソースへのライブコネクティビティとレプリケーション、セマンティックコンテキスト、組み込みガバナンスを提供。Databricks、Microsoft、Google、Palantir をはじめ、世界中の 10,000 以上のお客様の AI を支えています。

お問い合わせ

Informatica Enterprise Data Catalog で Google Translate のデータを追加

JDBC ドライバーのロード

JDBC リソースの設定

認証

OAuth 2.0 のセットアップと設定

ステップ 1：Google Cloud プロジェクトの作成と API の有効化

必須の接続プロパティ

必須の OAuth スコープ

組み込みの接続文字列デザイナー

検出されたメタデータの確認

はじめる準備はできましたか？

この記事の内容

関連記事

Informatica Enterprise Data Catalog で Google Translate のデータ を追加

JDBC ドライバーのロード

JDBC リソースの設定

認証

OAuth 2.0 のセットアップと設定

ステップ 1：Google Cloud プロジェクトの作成と API の有効化

必須の接続プロパティ

必須の OAuth スコープ

組み込みの接続文字列デザイナー

検出されたメタデータの確認

はじめる準備はできましたか？

この記事の内容

関連記事

Informatica Enterprise Data Catalog で Google Translate のデータを追加