Google Data Fusion で RabbitMQ に連携した ETL プロセスを作成

Jerod Johnson
Director, Technology Evangelism

CData JDBC Driver を Google Data Fusion にロードし、RabbitMQ のデータにリアルタイムでアクセスできる ETL プロセスを作成します。

Google Data Fusion を使用すると、セルフサービス型のデータ連携を行い、異なるデータソースを統合できます。CData API Driver for JDBC をアップロードすることで、Google Data Fusion のパイプライン内から RabbitMQ のデータにリアルタイムでアクセスできるようになります。CData JDBC Driver を使用すると、RabbitMQ のデータを Google Data Fusion でネイティブにサポートされている任意のデータソースにパイプできますが、この記事では、RabbitMQ から Google BigQuery へデータをパイプする方法を説明します。

CData API Driver for JDBC を Google Data Fusion にアップロード

CData API Driver for JDBC を Google Data Fusion インスタンスにアップロードして、RabbitMQ のデータにリアルタイムでアクセスしましょう。Google Data Fusion では JDBC ドライバーの命名規則に制限があるため、JAR ファイルを driver-version.jar という形式に合わせてコピーまたはリネームしてください。例：cdataapi-2020.jar

Google Data Fusion インスタンスを開きます
をクリックしてエンティティを追加し、ドライバーをアップロードします
"Upload driver" タブで、リネームした JAR ファイルをドラッグまたは参照します。
"Driver configuration" タブで以下を設定します：
- Name: ドライバーの名前（cdata.jdbc.api）を作成し、メモしておきます
- Class name: JDBC クラス名を設定します：（cdata.jdbc.api.APIDriver）
"Finish" をクリックします

Google Data Fusion で RabbitMQ のデータに接続

JDBC Driver をアップロードしたら、Google Data Fusion のパイプラインで RabbitMQ のデータにリアルタイムでアクセスできます。

Pipeline Studio に移動して、新しいパイプラインを作成します
"Source" オプションから "Database" をクリックして、JDBC Driver 用のソースを追加します
Database ソースの "Properties" をクリックしてプロパティを編集します
NOTE：Google Data Fusion で JDBC Driver を使用するには、ライセンス（製品版またはトライアル）とランタイムキー（RTK）が必要です。ライセンス（またはトライアル）の取得については、CData までお問い合わせください。
- Label を設定します
- Reference Name を将来の参照用の値に設定します（例：cdata-api）
- Plugin Type を "jdbc" に設定します
- Connection String を RabbitMQ の JDBC URL に設定します。例：
  
  jdbc:api:RTK=5246...;Profile=C:\profiles\\RabbitMQ.apip;AuthScheme=Basic;URL=http://localhost:15672;User=guest;Password=guest;
  
  RabbitMQ Management HTTP API について
  
  RabbitMQ は、複数のメッセージングプロトコルをサポートするオープンソースのメッセージブローカーです。RabbitMQ Management HTTP API は、RabbitMQ サーバーの管理データと監視データに HTTP 経由でアクセスする手段を提供します。この API では、仮想ホスト、エクスチェンジ、キュー、バインディング、コネクション、チャネル、コンシューマー、ユーザー、権限、ポリシー、クラスター全体の統計情報を取得できます。
  
  HTTP API を利用するには、RabbitMQ サーバーで Management プラグインを有効化する必要があります。デフォルトでは、管理インターフェースはポート 15672 でリッスンします。
  
  Basic 認証の設定
  
  RabbitMQ Management HTTP API は HTTP Basic 認証を使用します。RabbitMQ 管理ユーザーのユーザー名とパスワードを指定する必要があります。
  
  管理 API へのアクセスを有効にするには、以下のステップで進めます：
  1. サーバーで RabbitMQ Management プラグインが有効になっていることを確認します（rabbitmq-plugins enable rabbitmq_management）。
  2. 既存の管理ユーザーを使用するか、適切な管理タグ（management、policymaker、monitoring、または administrator）を持つユーザーを作成します。
  3. RabbitMQ Management HTTP API の完全なベース URL を控えておきます（例：http://localhost:15672）。
  RabbitMQ サーバーを設定したら、以下の接続プロパティを設定して接続します：
  - AuthScheme：Basic に設定します。
  - URL：RabbitMQ Management HTTP API のベース URL に設定します（例：http://localhost:15672）。
  - User：RabbitMQ の管理ユーザー名に設定します（例：guest）。
  - Password：RabbitMQ の管理パスワードに設定します。
  接続文字列の例：
```
Profile=C:\profiles\RabbitMQ.apip;AuthScheme=Basic;URL=http://localhost:15672;User=guest;Password=guest;
```
  利用可能なテーブル
  
  RabbitMQ プロファイルでは、以下のテーブルにアクセスできます：
  - Overview - クラスター全体の統計情報と RabbitMQ ノードに関する情報
  - Nodes - RabbitMQ クラスター内の個々のノードに関する情報
  - NodeMemory - 特定のクラスターノードの詳細なメモリ使用状況の内訳
  - Connections - ブローカーへのすべてのオープンな AMQP コネクションの一覧
  - Channels - すべてのコネクションにわたるオープンな AMQP チャネルの一覧
  - Consumers - すべてのキューに登録されたコンシューマーの一覧
  - Exchanges - すべての仮想ホストで宣言されたエクスチェンジの一覧
  - Queues - すべての仮想ホストで宣言されたキューの一覧
  - Bindings - エクスチェンジとキュー間のすべてのバインディングの一覧
  - VirtualHosts - ブローカーに設定された仮想ホストの一覧
  - VhostPermissions - 特定の仮想ホスト内のユーザー権限
  - Users - すべての RabbitMQ ユーザーの一覧
  - Permissions - すべての仮想ホストにわたる全ユーザーの権限レコード
  - TopicPermissions - 全ユーザーのトピックレベルの権限レコード
  - Policies - 仮想ホスト内のキューおよびエクスチェンジに適用されたポリシーの一覧
  - OperatorPolicies - 仮想ホスト内のキューに適用されたオペレーターポリシーの一覧
  - Parameters - 仮想ホストごとのコンポーネントパラメータ（例：federation、shovel）の一覧
  - GlobalParameters - すべての仮想ホストに適用されるグローバルパラメータの一覧
  - VhostLimits - 特定の仮想ホストに設定されたリソース制限
  - UserLimits - 特定のユーザーに設定されたリソース制限
  - FeatureFlags - フィーチャーフラグの一覧と、ノード上での有効／無効の状態
  - DeprecatedFeatures - 非推奨機能の一覧と、その使用状態
  - AuthAttempts - ノードの認証試行統計
  - ClusterName - RabbitMQ クラスターの名前
  - WhoAmI - 現在認証されている管理ユーザーに関する情報
  - ExchangeBindingsSource - 特定のエクスチェンジがソースとなっているバインディング
  - ExchangeBindingsDestination - 特定のエクスチェンジが宛先となっているバインディング
  - QueueBindings - 仮想ホスト内の特定のキューのバインディング
  ビルトイン接続文字列デザイナー
  
  JDBC URL の作成には、RabbitMQ JDBC Driver に組み込まれている接続文字列デザイナーを使用できます。JAR ファイルをダブルクリックするか、コマンドラインから JAR ファイルを実行してください。
```
      java -jar cdata.jdbc.api.jar
      
```
  接続プロパティを入力し、接続文字列をクリップボードにコピーします。
- Import Query を RabbitMQ から取得したいデータを抽出する SQL クエリに設定します。例：
  SELECT * FROM AuthAttempts
"Sink" タブから、同期先シンクを追加します（この例では Google BigQuery を使用します）
BigQuery シンクの "Properties" をクリックしてプロパティを編集します
- Label を設定します
- Reference Name を api-bigquery のような値に設定します
- Project ID を特定の Google BigQuery プロジェクト ID に設定します（またはデフォルトの "auto-detect" のままにします）
- Dataset を特定の Google BigQuery データセットに設定します
- Table を RabbitMQ のデータを挿入するテーブル名に設定します

Source と Sink を設定すると、RabbitMQ のデータを Google BigQuery にパイプする準備が整います。パイプラインを保存してデプロイしてください。パイプラインを実行すると、Google Data Fusion が RabbitMQ からリアルタイムデータをリクエストし、Google BigQuery にインポートします。

これはシンプルなパイプラインの例ですが、変換、分析、条件などを使用してより複雑な RabbitMQ パイプラインを作成できます。CData API Driver for JDBC の 30日間の無償トライアルをダウンロードして、今すぐ Google Data Fusion で RabbitMQ のデータをリアルタイムで活用しましょう。

はじめる準備はできましたか？

API Driver で RabbitMQ のライブデータに接続

RabbitMQ に接続

CData は、AI を本番環境で機能させるデータレイヤーです。数百の主要エンタープライズソースへのライブコネクティビティとレプリケーション、セマンティックコンテキスト、組み込みガバナンスを提供。Databricks、Microsoft、Google、Palantir をはじめ、世界中の 10,000 以上のお客様の AI を支えています。

お問い合わせ

Google Data Fusion で RabbitMQ に連携した ETL プロセスを作成

CData API Driver for JDBC を Google Data Fusion にアップロード

Google Data Fusion で RabbitMQ のデータに接続

RabbitMQ Management HTTP API について

Basic 認証の設定

接続文字列の例：

利用可能なテーブル

ビルトイン接続文字列デザイナー

はじめる準備はできましたか？

この記事の内容

関連記事

Google Data Fusion で RabbitMQ に連携した ETL プロセスを作成

CData API Driver for JDBC を Google Data Fusion にアップロード

Google Data Fusion で RabbitMQ のデータ に接続

RabbitMQ Management HTTP API について

Basic 認証の設定

接続文字列の例：

利用可能なテーブル

ビルトイン接続文字列デザイナー

はじめる準備はできましたか？

この記事の内容

関連記事

Google Data Fusion で RabbitMQ のデータに接続