Tableau Cloud で作成したフローをTableau Prep Conductor でスケジュールし、ODBC データソースに対する定期更新と前処理を自動実行してパブリッシュする方法

by 周建强 | February 28, 2025

ODBC Tableau Cloud Prep Conductor

こんにちは。プロダクトチームの周です。

CData ODBC ドライバとTableau Bridge を使用してODBC データソースをTableau Cloud に「抽出」接続でパブリッシュする方法は、こちらのブログ記事で紹介してありますが、本記事ではもう一歩進んで、Tableau Prep Conductor によるフローの自動実行で、Tableau Cloud にパブリッシュされたODBC データソースを、定期的に更新・加工して前処理済の最新データソースとしてパブリッシュする方法を紹介いたします。

フローのパブリッシュ

Tableau Prep Conductor で自動実行をスケジュールするフローはTableau Cloud にパブリッシュする必要があります。フローのパブリッシュは、Tableau Prep Builder を使用する方法と、Tableau Cloud で直接フローを作成する方法がありますが、今回はTableau Cloud で直接フローを作成する方法を紹介いたします。

1.Tableau Cloud にサインインして、「探索」メニューから"default"プロジェクトを開きます。今回は"Customers (GRAPHQL-2024-07.Customers) (CData)"というデータソースをクリックし、Tableau Cloud にパブリッシュされたShopify のCustomers データを使用します。

※このデータソースはCData ODBC Driver for Shopify とTableau Bridge を使用してTableau Cloud に「抽出」接続でパブリッシュされたものです。パブリッシュ方法はこちらのブログ記事をご参照ください。

Image2222

2.パブリッシュされたODBC データソースの"Customers (GRAPHQL-2024-07.Customers) (CData)"画面から「…」をクリックして、メニューから「新しいフロー」をクリックします。

Image2223

3.新しいフローの「入力」としてShopify のCustomers データが表示されることを確認します。

Image2224

4.データを加工するいろいろなステップをフローに追加できますが、今回は「クリーニング」ステップとして「Email」フィールドに対してワイルドカードのフィルターをかけることにします。

Image2225

5.最後にフローの「出力」を追加し、出力先として「パブリッシュされたデータソース」を選択し、プロジェクト(例:"default")と名前(例:"test.com Customers")を指定します。

Image2226

6.「パブリッシュ」をクリックし、完成したフローを名前(例:"test.com Customers Flow")を付けてパブリッシュします。

Image2228

7.パブリッシュされたフローを表示して、「実行」をクリックします。正常に終了することを確認します。

Image2229

フローの入力としてデータソースの定期更新をスケジュール

1.Tableau Cloud で"default"プロジェクトから上記フローの入力として使用されたデータソースの"Customers (GRAPHQL-2024-07.Customers) (CData)"を開きます。

※このデータソースはCData ODBC Driver for Shopify とTableau Bridge を使用してTableau Cloud に「抽出」接続でパブリッシュされたものです。パブリッシュ方法についてはこちらのブログ記事をご参照ください。

Image2216

2.「抽出の更新」タブで「新しい抽出更新」をクリックし、このデータソースの定期更新を、例えば平日毎日23:30にスケジュールします。

Image2217

フローの自動実行をスケジュール

1.Tableau Cloud にパブリッシュされた上記フローの"test.com Customers Flow"を"default"プロジェクトから開きます。

Image2231

2.「スケジュールされたタスク」タブで「新しいタスク」をクリックし、このフローの定期実行を、例えば平日毎日23:55にスケジュールします。

Image2232

スケジュールされたジョブの確認

1.上記スケジュールされたジョブのステータスなどは「ジョブ」画面で確認できます。

Image2219

2.データソースの定期更新、そしてフローの定期実行を前後にスケジュールすることによって、最新データソースの前処理が自動化され、フローの出力としてパブリッシュされるデータソースの"test.com Customers"は前処理済の最新データとしてユーザーに提供できるようになります。

Image2233

おわりに

本記事ではTableau Prep Conductor によるフローの自動実行で、Tableau Cloud にパブリッシュされたODBC データソースを、定期的に更新・加工して前処理済の最新データソースとしてパブリッシュする方法を紹介してみました。各種データソースからTableau へのデータ連携で是非CData 製品をご活用ください。

CData ODBC Drivers は30日間の無償トライアルが可能です。ぜひお試しくださいませ。
https://jp.cdata.com/odbc/