導入事例
大規模な需要予測を可能に

ビッグデータとAIの活用により、店舗数50万のオペレーションを最適化

業種:消費者向けパッケージ品

ソリューション:需要予測の策定

ユースケース:データの取り込み、ETL処理、機械学習

地域:英国/欧州

英消費財大手レキットベンキーザー・グループ(RB)にとって、需要予測は、数百万の小売企業にサービスを提供するための鍵となります。しかし、多数のパイプラインに分散した、異なるタイプの膨大なデータを抱え、需給予測は複雑さを増していました。RB 社は、解決策として Azure Databricks の統合データ分析プラットフォームを導入し、機械学習によって得られる洞察を活用した予測分析、プロダクトプレイスメント、景気予測を通じて、食料品スーパーなど多数の小売店への支援を強化しています。

課題

RB 社は、世界 60 か国以上において日用消費財の販売を展開しています。その主要な市場セグメントの 1 つは、地元スーパーなどの中小規模販売店です。この市場は細分化されており、アジア、アフリカ、南米の新興市場を中心に、何百万もの小さな家族経営の商店が含まれています。RB 社では、16,000 人規模の体制でこの市場へのサービスに取り組んでいます。担当者は各店舗を訪問し、それぞれの店舗のニーズに合った品揃えを支援します。

データは、需要予測において最も重要なリソースの1つです。RB 社では、さまざまなタイプの膨大な量のデータが、多数のパイプラインに分散して存在しており、これらのデータを効率よく処理する方法がないことが問題となっていました。顧客である商店の成長を支援するためには、データから得られる洞察を活用したいところですが、データはあるのに有効利用できない、というジレンマに陥っていました。具体的には次のような課題を解決する必要がありました。

  • 膨大なデータの処理:24 時間 365 日稼働する 250 を超えるパイプラインから取り込まれる 2 TB 超のデータを効率的に処理したい。
  • 外部データセットの処理:財務、営業、オペレーションなどの社内の部門が、PoS、eコマース、ニールセン、消費者分析などの外部データベースの利用を必要としていたが、アクセスと処理が困難であった。
  • Hadoop ベースのインフラの複雑さ:従来の Hadoop ベースのインフラを使用していたが、複雑で、拡張するにもコストがかかり、十分な性能を得られず、新しいデータセットの展開も難しい状況であった。そのため、DevOps 部門は問題の監視と修正に時間を取られ、迅速な洞察の提供ができなかった。

ソリューション

Azure Databricks 上の統合データ分析プラットフォームによってスケーラブルな共同作業環境を構築。データサイエンスとデータエンジニアリング部門のコラボレーションが促進され、データを活用したイノベーションが加速し、機械学習を利用した洞察を迅速に提供できるようになった。

  • フルマネージド型プラットフォームとクラスタの自動管理:規模の大小に関わらず、インフラとその運用がシンプルになった。
  • ノートブック環境でのコラボレーション:複数の言語(SQL、Scala、Python、R)をサポートするノートブック環境で、さまざまな部門のユーザーが、使い慣れた言語で共同作業できるようになった。
  • Delta Lake のサポート:Delta Lake をネイティブにサポートすることで、データセットの圧縮が可能になり、コストとストレージ容量の最適化が可能になった。

結果

RB 社は、Databricks の導入により、大幅な性能向上とコスト管理の改善を実現し、ビジネスの拡大と新たな商機のより早い発見が可能になりました。

  • コスト最適化:Delta Lake を利用することで、大幅なデータ圧縮が可能になり(80 TB から 2 TBへ)、コスト効率が向上。ダウンストリーム分析のためのパイプラインも高速になった。
  • 迅速な洞察抽出:Databricks によるパイプラインの高速化 ― 24 時間 365 日実行されるジョブの処理時間が 1/2 に短縮(パイプライン全体の実行時間が 24 時間から 13 時間に短縮)。結果、DebOps コストの大幅削減、および、より多くのユースケースの展開が可能になった。
  • 市場シェアの拡大:Databricks 導入によるデータ処理力増強により、対応可能な顧客数が 10 倍になった。Databricks 導入以前の対応可能な店舗数は最大 45,000 であったが、導入後は 500,000 店舗を支援できるようになった。
  • 10 倍
    ビジネス規模 10 倍に拡大
  • 98%
    データ圧縮 80 TB→2 TB、
    運用コスト削減
  • 2 倍
    処理速度 2 倍に高速化、
    データパイプラインの性能アップ

「Databricks を利用することで、実験から本稼働へのスケーリングを素速く行えるようになりました。Databricks のプラットフォームは、我々のビジネスの成長を支えています。」

RB社 高度分析部門ディレクター
アティフ・アメッド氏

関連リソース


テクニカルトーク(Spark + AI Summit EU 2019 より)

無料お試し・その他のご相談を承っております

Databricks の無料トライアル製品について詳しく見るご相談・お問い合わせ