企業の業務モダナイゼーションが進む中、データドリブンな意思決定を支える要としてデータ連携の重要性は増し続けています。CData Sync は、シンプルかつパワフルな ETL/ELT ツールで次世代のデータドリブンビジネスを推進します。
CData プロダクトマネジメントディレクターの Jaclyn Wands が、最新の CData Sync リリースの内容と、プロダクトチームが今後取り組んでいることについて語ってくれました。今回のアップデートのポイントは以下のとおりです。
シングルサインオン(SSO)
Microsoft Teams・Slack 通知
dbt Cloud サポート
dbt Core GitHub サポート
デスティネーションでのデータ変換
1. CData での役割と、Sync にどのように関わっているか教えてください。
Wands:2022年の 4 月に CData のプロダクトチームに加わり、CData Sync と CData DBAmp に関するマーケティング・セールス・プロダクト・エンジニアリング間の連携を担当しています。チーム全体が同じ方向を向き、すべての目標を可視化して着実に達成していけるよう、部門横断でのコーディネーションを行っています。
2. ユーザーが期待できる CData Sync のアップデートと、注目ポイントを教えてください。
Wands:2022 年版の CData Sync には、とてもワクワクする内容が詰まっています。まず基本的なメンテナンスとして、Sync のセキュリティ機能を最高水準に保ちつつ、シングルサインオン(SSO)などの機能でアクセスのしやすさを向上させています。
また、Microsoft Teams・Slack 通知の追加により、既存システムとの連携をよりシームレス・自動化・スケーラブルにしました。ジョブが失敗した際に、ユーザーが普段使っているプラットフォームへ自動でアラートが送信されるため、データオーナーは管理作業に時間を取られることなく、ワークフローの問題をすぐに把握して対応できるようになります。
さらに、デスティネーションでのデータ変換機能を拡張し、ユーザーのワークフローに合った形でデータの抽出・加工がしやすくなりました。
もうひとつ、データサイエンスのバックグラウンドを持つ私が特に注目しているのが、dbt Core GitHub および dbt Cloud との本格的な統合です。CData Sync 内から直接 dbt の高度なデータ変換機能を利用し、管理タスクを自動化できるようになりました。この統合により、クラウドでもオンプレミスでも、データの移動を扱う環境でシームレスに作業を進められます。
CData Sync と dbt を組み合わせて活用する方法について詳しくは、dbt Labs テクノロジーパートナーシップヘッドの Nikhil Kothari と CData プロダクトマーケティングマネージャーの Matt Springfield が登壇するウェビナー「Easily Replicate Disparate Cloud and On-Premises Data with dbt and CData」を視聴してください。
ウェビナーを視聴
3. dbt とのパートナーシップを深めるきっかけは何だったのでしょうか?
Wands:CData Sync の大きな目標のひとつは、ひとつのツール内であらゆる作業をより簡単にこなせるようにすることです。
CData Sync は、A から Z まであらゆるデータソースからシグナルを取得できる、いわば「データの神経系」のような存在です。一方、dbt にはユーザーが求める高度な変換機能があります。現在、ユーザーは API を通じて dbt を CData Sync に接続できるようになっています。これにより、Sync 内で dbt プロジェクトをダイナミックに選択でき、単一のインターフェースからデータパイプラインの操作をより柔軟にコントロールできます。dbt とのパートナーシップの深化は、CData Sync のデータパイプラインをユーザーにとってさらに強力なものにしてくれます。
詳しくは、 dbt Labs とのウェビナーを視聴してください
4. これらの新機能をお客様はどのように活用すると考えていますか?
Wands:最終的に私たちが目指しているのは、CData Sync のお客様がツール上で過ごす時間を減らすことです。データ連携のプロセスが「ただ動く」状態になれば、ユーザーは本来の業務にもっと時間を使えるようになる。それを実現するために日々取り組んでいます。
今日のデータサイエンティストは、依然として作業時間の約 45% をデータのクリーニングと移動に費やしているといわれています。私自身のデータサイエンティストとしての経験では、65% 以上の時間をデータクリーニングに充てていたこともあります。
ユーザーが本当にやりたいのは、機械学習モデルの構築やシステム統合をすぐに始めて、必要な場所に必要なデータがある状態を作ることです。効率化・自動化されたシステムが整っていれば、手作業でデータをクリーニング・移動する必要はなくなります。
たとえば、dbt Cloud との統合により、ソースからデスティネーションまでの一気通貫の可視性が得られ、機械学習モデルに投入するデータが想定どおりの状態になっているかを確認できます。加えて、Slack 通知を使えば、テラバイト・ペタバイト規模のデータに煩雑な方法で手を入れることなく、個々のユーザーがジョブの失敗をモニタリングできます。大規模なエンタープライズにとってもスケーラブルな運用が可能です。
CData Sync の新機能によって、手作業に費やす時間を少なくとも半分に削減できると考えています。Sync は、データエンジニア、データサイエンティスト、機械学習エンジニアが、本来注力すべき高付加価値なプロジェクトに集中できる環境を提供します。CData Sync とその将来の機能開発には多くの目標がありますが、常に目指しているのは、企業の既存リソースの時間を解放し、新規採用の必要性を減らしてコスト削減に貢献することです。
5. 今後数か月の Sync のロードマップについて教えてください。
Wands:入社 1 年目に、全チームのサポートチケットとイネーブルメントの詳細な分析を行い、CData Sync の今後の方向性を描くことができました。現在チームが特に力を入れているのが、ユーザーインターフェース(UI)の全面的な再設計です。
昨年新たに採用した優秀な UX デザイナーチームのおかげで、CData Sync のユーザーエクスペリエンス(UX)は見違えるほど改善される予定です。UI の再設計をリリースする前には、パワーユーザーの皆さまから直接フィードバックをいただく取り組みも進めています。才能あるデザイナーやエンジニアと一緒に、あらゆるタイプのユーザーにとって使いやすい UI を実現できることにワクワクしています。
2023 年のロードマップとしては、テストモジュールの拡張と安定性の検証を進めています。加えて、デプロイ・インストール体験を刷新し、ユーザーエクスペリエンスに大きなモダナイゼーションをもたらす計画も進行中です。この取り組みを市場に届けるチームの一員であることを、とても誇りに思います。
「データを移動するならまず CData Sync」――エンジニアの間でそう認知されるツールにしたい。データサイエンティストとしての自分自身の経験を活かしながら、その目標に向かって進み続けます。
今すぐ CData Sync を始めましょう
CData Sync と dbt の連携がデータ連携をどのように強化するか、詳しくはウェビナーを視聴してください。今すぐ CData Sync を使ってみたい方は、フル機能の無償トライアルをお試しください。数分で始められます。
※本記事はCData US ブログ Q&A with CData Director of Product Management Jaclyn Wands: What’s New with Sync? の翻訳です。