導入事例
データと AI で
ペットの健康と幸せを守る

INDUSTRY: Life sciences

SOLUTION: Clinical health data lake, digital pathology, disease 
prediction, genetic 
association studies

PLATFORM USE CASE: Delta Lake, data science, machine learning, ETL

CLOUD: Azure

 

50 を超えるブランドを展開するペットケア業界大手 Mars Petcare(マースペットケア)は、ペットの健康と幸せを守るため、データと AI を活用しています。
 
動物の健康に関する詳細な情報を把握するうえで、データは重要な役割を担っており、膨大な量の多様なデータをいかに処理するかが課題となっていました。マースペットケアは、この課題を解決すべく、Azure Databricks と Delta Lake を導入し、ペットケアのためのデータプラットフォームを構築しました。データドリブンかつ迅速な意思決定が可能になり、機械学習を活用したヘルスケアから、末期疾患の診断・予測まで、ペットの健康に関わるさまざまな問題を解決しています。

チームとデータのサイロ化が迅速な分析の障壁に

マースペットケアは、ペットの総合的な健康状態の把握に必要な情報を飼い主に提供することをミッションとしています。医療機器から栄養食まで、ペット業界のさまざまな分野に特化した複数のブランドを展開しており、獣医師のメモや診断書、食事療法、ゲノミクスデータなど、さまざまなデータを保有しています。マースペットケアは、このようなあらゆるデータを組み合わせ、ペットの健康を改善するための新たな方法の特定に着手しました。

しかし、複数のブランドがそれぞれ独自のソースシステム、データセット、プロセス、モデルを使用していたため、各ブランドが独自に取得、保存、分析したデータをエンジニアリングチームが分析に活用することは困難でした。このようなデータの品質や形式の大きな相違は、データエンジニアリングの観点から見ると、さまざまな複雑性を生み出していました。

ビジネスのサイロ化が原因で、ETL パイプラインの構築は複雑で多くの時間を要していました。ビジネスユニットの分断は、データ分析やデータサイエンティストの生産性にも影響を及ぼしていました。チーム間でのコラボレーションを効率的に実施することができず、分析やモデル構築に必要なデータの入手に支障をきたしていたのです。

データの集約と一元管理でヘルスケア変革を加速

データチームは、さまざまなデータソースの価値を完全に実現するために、統合データ分析プラットフォームを必要としていました。Azure Databricks の導入によって、JDBC 接続でさまざまなデータソースへの容易なアクセスが可能になりました。これにより、エンジニアリングチームに負担をかけることなく、規模の大小に関わらずインフラをプロビジョニングでき、さまざまなデータチームやビジネスユニット間でデータの共同作業が容易になりました。

Azure サービスとのシームレスな統合、無限の拡張性、コラボレーション型 Notebook など、Databricks はマースペットケアにとって明確な選択でした。Delta Lake によるメタデータ処理と ACID トランザクションによって、データサイエンスチームが直接 ACID 準拠のデータにアクセスして分析やモデル構築ができるようになり、データ管理とパイプラインがシンプルになっています。バージョニングにより、データエンジニアはトランザクションログや更新履歴の問題をデバッグできます。また、タイムトラベルにより古いバージョンの復元が可能です。Databricks と Delta Lake のシームレスな連携により、メタデータ層の可視化、トランザクションログの直接閲覧、ファイルの種類やサイズの表示など全てが単一プラットフォームで可能になります。

ETL パイプラインを整備したことで、分析およびデータサイエンスチームは、データをより簡単に扱えるようになりました。バージョン管理されたデータへのアクセスが可能になり、アナリストはプロジェクトの容易な再作成や更新データセットでのモデル検証、さらには以前のバージョンの分析を行い、欠如していた気づきを取得できるようになりました。また、コラボレーション型 Notebook により、ビジネスユニットを超えたさまざまなチームのデータが民主化され、誰もがニーズに合わせてデータにアクセスして活用できるようになりました。

迅速な知見抽出がヘルスケアソリューションを促進

マースペットケアは、Databricks と Delta Lake の利点を活かしてペットヘルスケアの革新を加速させています。インフラの管理が効率的になり、クラスタのスピンアップの複雑さの解消、コスト削減が実現しています。さらに、自動スケーリングなどの諸機能によってコンピューティングの使用量が低減し、クラウドによるインフラ全体のコスト削減につながっています。

データドリブンで実践的な気づきを活用し、例えば高齢猫の末期疾患の予測、健康問題を示唆する行動の特定、犬の健康状態を特定する DNA 分析など、ペットのヘルスケアに変革を起こしています。

マースペットケアの全ブランドのデータチームは、Databricks の統合データ分析プラットフォームの導入によって単一データソースの共有とコラボレーションを実現し、データの活用によるペットの健康増進とウェルビーイングのための新たな方法の発見に向けて邁進しています。

無料お試し・その他のご相談を承っております

Databricks の無料トライアル製品について詳しく見るご相談・お問い合わせ