Databricks(AWS)でe-Sales Manager のデータを処理・分析

Jerod Johnson
Jerod Johnson
Senior Technology Evangelist
CData、AWS、Databricks を使用して、リアルタイムe-Sales Manager のデータに対してデータエンジニアリングとデータサイエンスを実行。

Databricks は、Apache Spark を通じたデータ処理機能を提供するクラウドベースのサービスです。CData JDBC Driver と組み合わせることで、Databricks を使用してリアルタイムe-Sales Manager のデータに対してデータエンジニアリングとデータサイエンスを実行できます。この記事では、AWS でCData JDBC Driver をホストし、Databricks でリアルタイムe-Sales Manager のデータに接続して処理する方法を説明します。

最適化されたデータ処理が組み込まれたCData JDBC Driver は、リアルタイムe-Sales Manager のデータを扱う上で比類のないパフォーマンスを提供します。e-Sales Manager に複雑なSQL クエリを発行すると、ドライバーはフィルタや集計などのサポートされているSQL 操作をe-Sales Manager に直接プッシュし、サポートされていない操作(主にSQL 関数やJOIN 操作)は組み込みSQL エンジンを利用してクライアント側で処理します。組み込みの動的メタデータクエリを使用すると、ネイティブデータ型を使ってe-Sales Manager のデータを操作・分析できます。

CData JDBC Driver をDatabricks にインストール

Databricks でリアルタイムe-Sales Manager のデータを操作するには、Databricks クラスターにドライバーをインストールします。

  1. Databricks の管理画面に移動し、対象のクラスターを選択します。
  2. Libraries タブで「Install New」をクリックします。
  3. Library Source として「Upload」を選択し、Library Type として「Jar」を選択します。
  4. インストール場所(通常はC:\Program Files\CData[product_name]\lib)からJDBC JAR ファイル(cdata.jdbc.esalesmanager.jar)をアップロードします。

ノートブックでe-Sales Manager のデータにアクセス:Python

JAR ファイルをインストールしたら、Databricks でリアルタイムe-Sales Manager のデータを操作する準備が整いました。ワークスペースに新しいノートブックを作成します。ノートブックに名前を付け、言語としてPython を選択し(Scala も利用可能)、JDBC ドライバーをインストールしたクラスターを選択します。ノートブックが起動したら、接続を設定し、e-Sales Manager をクエリして、基本的なレポートを作成できます。

e-Sales Manager への接続を設定

JDBC Driver クラスを参照し、JDBC URL で使用する接続文字列を構築してe-Sales Manager に接続します。また、JDBC URL でRTK プロパティを設定する必要があります(Beta ドライバーを使用している場合を除く)。このプロパティの設定方法については、インストールに含まれるライセンスファイルを参照してください。

ステップ1:接続情報

driver = "cdata.jdbc.esalesmanager.ESalesManagerDriver"
url = "jdbc:esalesmanager:RTK=5246...;User=MyUsername;Password=MyPassword;URL=MyInstanceURL;TenantId=MyTenantId;"

組み込みの接続文字列デザイナー

JDBC URL の作成をサポートするために、e-Sales Manager JDBC Driver に組み込まれている接続文字列デザイナーが使用できます。JAR ファイルをダブルクリックするか、コマンドラインからJAR ファイルを実行します。

java -jar cdata.jdbc.esalesmanager.jar

接続プロパティを入力し、接続文字列をクリップボードにコピーします。

e セールスマネージャー Remix に接続するには、User、Passowrd、URL、TenantId パラメータが必要です。

  • User:API を実行するためのログインユーザーのユーザーID。
  • Password:API を実行するためのログインユーザーのユーザーパスワード
  • URL:e-Sales Manager Remix エンドポイントへのURL。例:https://XXX.softbrain.co.jp
  • TenantId:e-Sales Manager Remix テナント名のTenantd。例:cdata

e-Sales Manager のデータをロード

接続を設定したら、CData JDBC Driver と接続情報を使用して、e-Sales Manager のデータをDataFrame としてロードできます。

ステップ2:データの読み取り

remote_table = spark.read.format ( "jdbc" ) \
	.option ( "driver" , driver) \
	.option ( "url" , url) \
	.option ( "dbtable" , "Customer") \
	.load ()

e-Sales Manager のデータを表示

ロードしたe-Sales Manager のデータをdisplay 関数を呼び出して確認します。

ステップ3:結果の確認

display (remote_table.select ("Name"))

Databricks でe-Sales Manager のデータを分析

Databricks SparkSQL でデータを処理するには、ロードしたデータをTemp View として登録します。

ステップ4:ビューまたはテーブルを作成

remote_table.createOrReplaceTempView ( "SAMPLE_VIEW" )

Temp View を作成したら、SparkSQL を使用してe-Sales Manager のデータをレポート、ビジュアライゼーション、分析用に取得できます。

% sql

SELECT Name, Address FROM SAMPLE_VIEW ORDER BY Address DESC LIMIT 5

e-Sales Manager からのデータは、対象のノートブックでのみ利用可能です。他のユーザーと共有したい場合は、テーブルとして保存します。

remote_table.write.format ( "parquet" ) .saveAsTable ( "SAMPLE_TABLE" )

CData JDBC Driver for e-Sales Manager Remix の30日間無償トライアルをダウンロードして、Databricks でリアルタイムe-Sales Manager のデータの操作をはじめましょう。ご不明な点があれば、サポートチームにお問い合わせください。

はじめる準備はできましたか?

e-Sales Manager Remixi Driver の無料トライアルをダウンロードしてお試しください:

 ダウンロード

詳細:

e-Sales Manager Remix Icon e-Sales Manager Remix JDBC Driver お問い合わせ

商品、在庫、発送状況などのe-Sales Manager データを組み込んだ強力なJava アプリケーションを迅速に作成して配布できます。