下記の記事で企業運営にとってダッシュボードが有用であることをお伝えしました。
ダッシュボードのある企業 vs ない企業|VUCA 時代を生き残るのはどっち?
「ならば、ダッシュボードつくるか!」となった場合、上記の記事でご紹介したとおり、つくり方としては大きく2つあります。
ひとつは、ダッシュボード作成ツール(例:MotinonBoard、Power BI、Tableauなど)とEC サイトやPOS レジなどのデータソース(データ発生源)を直接つなぐ方法です。
もう一つは、データソースのデータをデータベースやデータウェアハウスへコピー(複製)、集約し、ダッシュボード作成ツールは集約したデータを活用する、いわゆるデータ基盤をつくる方法です。
それぞれ一長一短があり、どちらの方法がマッチするかはケース・バイ・ケースです。
いずれの方法をとるにせよ共通して言えるのは、データ接続・データ収集は手間がかかるということです。
VHS vs ベータマックス、DVD vs ブルーレイどこじゃない!お作法戦国時代
どうして手間がかかるのか?下図は、ごくごく一部ですがデータ接続・収集のお作法を整理したものです。
図の左側、データソースだけみてみても、そのデータソースがSaaS(API)なのか、ファイルなのか、データベースなのか、SaaS ひとつとってもSOAP というお作法、OData というお作法、GraphQL というお作法…とお作法が乱立している状態です。
他方、ダッシュボード作成ツール側もお作法が乱立しています。
このようにデータ接続・収集を行う際には、データソース(およびツール)ごとに方法を使い分ける必要があり、結果手間がかかりがちです。
全てのお作法に対応したツールなどがあればよいのですが、現状(わたしが調べた限りでは)そういったツールはこの世に存在せず、自作するにしても安定したデータ収集を実現するためには、多くの技術やノウハウが必要です。
自作をおすすめしない理由
データ接続・収集の仕組み、上記の図で言うところの仲介役は自作することも可能です。
実際、わたしは、とあるプロジェクトでデータ収集のプログラムを自作(手組み)したことがあります。
ですが、データ取得の仕方がデータの種類によってバラバラだったり、データベース側にデータ入れる箱(テーブル)を用意するための設計や重複してデータを登録しないようにする仕組み、エラー発生時の仕組みなど考慮すべき事項が非常に多く、たった1種類のデータをデータベースに連携するだけでも、一人でひと月かけても終わらない、そんな感じでした(2種類目以降は1種類目でつくった仕組みを流用したのでだいぶ工数を削減できましたが…)。
加えて残念なことに「できあがった~」と思ったら、元のデータの構造が変わってしまい、そのたびに作った仕組みをメンテナンスしなければならない事態にも陥りました。
というわけで、データ接続・収集の仕組みは自作、手組みできるのですが個人的にはおすすめしません。とっても面倒です。
データ接続・収集に時間をかけるべきなのか?
それに、そもそもの話なのですが、データ分析プロセスにおけるデータ接続・収集の重要度ってどの程度でしょうか?
時間をかけるべきポイントなのでしょうか?
時間をかけるべきは、ダッシュボードによって可視化された企業の運営状況から問題を発見したり、その問題の解決に向けた仮説構築や仮説検証、また仮説の検証結果をもとになされる意思決定(経営判断)やその後の施策の策定や実行などのPDCA の方ではないでしょうか?
なぜなら1発で真の問題を見つけ出せるとは限らないですし、仮説構築や仮説検証とて同様です。
仮にスムーズに問題を発見し、意思決定まで進めたとしても、その後の施策の策定や実行などのPDCA を1サイクルまわしただけで問題の解決という結果・成果にたどりつけるとは限りません。
そう考えるとダッシュボードはサクッと作ってしまって、ダッシュボード作成後の工程にできるだけ多くの時間を当てた方が、企業運営により良いインパクトを与えられるように感じられます。
では、できるだけサクッとデータ接続・収集し、ダッシュボードを作るにはどうしたらよいのでしょう?
その方法の一つがCData です!
CData という選択肢がある企業は強いと思う理由
ダッシュボードを作るにあたっては、Power BI やTableau といったBI ツールを利用することになると思います。
CData 製品を利用するとツールの使いごこちはそのままに、単純に接続できるデータソースの数を増やすことが可能です。
対応データソースは現在250以上、データの読み取り(抽出)のみに対応した製品も含めると400 を超えるデータソースに対応しています。
ですので、CData 製品を利用するとデータ接続・収集の仕組みの自作という工程をスキップできる可能性があります。
この可能性を持っているか、持っていないかではダッシュボード作成はもちろん、データ分析プロセスそのものの進捗スピードやクオリティなどが大きくかわってくることは簡単に想像いただけるんじゃないでしょうか?
ダッシュボード作成にオススメのCData 製品
ダッシュボード作成というシーンに限定すると、次の3つの製品がオススメです。
今この瞬間のデータに接続するなら
まず、ダッシュボード作成ツールとデータソースを直接つなぐ方法でダッシュボードを作る場合は、CData Drivers、あるいはCData Connect AI がオススメです。
CData Drivers は、Power BI デスクトップなどのツールを利用しているマシンに一緒にインストールして利用する、インストール型の製品です。
インストールしたCData Drivers を介して250を超えるデータソースに接続いただくことが可能になります。
ご利用のツールがブラウザでアクセスする、Looker Studio のようなクラウドサービス型のツールの場合は、CData Connect AI がオススメです。
CData Connect AI はCData Drivers をサービス化、SaaS 化したもので、CData Connect AI を経由することで140を超えるデータソースとツールを接続することが可能です。
データ基盤をつくるなら
次に、データソースのデータをデータベースやデータウェアハウスへコピー(複製)、集約し、ダッシュボード作成ツールは集約したデータを活用する、いわゆるデータ基盤をつくる方法の場合。この場合はCData Sync がオススメです。
CData Sync は400を超えるデータソースのデータをノーコードでMySQL などのリレーショナルデータベース、Snowflake などのデータウェアハウスに複製できる製品です。
CData Sync の特長の一つは、差分更新で通信量を抑え、スピーディーなデータ複製、データ同期を実現できる点です。
具体的には、1回目の複製は全件データを複製します。なお、このとき同期先のデータベースに自動でテーブルをCREATE しますのであらかじめデータの入れ先を設計するなどの準備は不要です。
2回目以降は、更新のあったレコードのみを複製する、ということも可能です。そのため、1日あたりの使用回数制限のあるAPI を使用する場合、コール数を削減することができますし、2回目以降はデータ量が減りますので、複製にかかる時間も削減することができます。
CData を活用してライバルに差をつけよう!
CData 製品を活用するとデータ接続・収集にかかる時間を圧縮し、より重要度の高いプロセスに時間を割り当てられるようになります。
その結果、迅速な意思決定、さらには施策の立案、実行にうつせますのでライバルに差をつけることもできるのではないでしょうか