スターバックス
導入事例
データと機械学習/AIの大規模な融合

Databricksを活用し、3万店舗のオムニチャネル戦略を促進

業種: 小売・消費財

ソリューション: 需要予測の策定、パーソナライゼーション、製品イノベーション

ユースケース(技術面):機械学習、データの取り込み、ETL

コーヒーチェーン世界大手の米スターバックス社は、世界中のコーヒー愛好家に日々サービスを提供しています。スターバックスは、最高水準の顧客サービスを維持するために、顧客との継続的なつながりの構築、製品イノベーションの創出、顧客のデジタル体験の改善に注力しています。データはスターバックスにとって成功の鍵であり、分析結果は、在庫管理の改善やデジタル体験のパーソナライズなどさまざまな領域に活用されています。スターバックスでは、データ活用促進のため、Databricksを利用した統合データ分析インフラストラクチャを導入しました。ペタバイト規模の高速データパイプラインによって機械学習モデルを素速く構築し、企業全体における在庫管理の改善や、新たな製品・サービスのイノベーションに役立てています。

大規模データと機械学習をサポートするアーキテクチャの構築

スターバックスのビジネス戦略において、データは極めて重要なリソースです。3万店以上ある店舗から生成された数十億のトランザクションデータポイントは、データ駆動型のイノベーションと業務改善の促進に活用されます。スターバックスにおけるデータ戦略および指針は、「単一のデータソース」、「データの可用性と分析の有効化」、「信頼できるデータ」の3本の柱を中心としたものであり、データから価値を引き出すことは最優先課題となっていました。しかし、ペタバイト規模のデータの取り扱いは困難でした。

既存のアーキテクチャも問題になっています。ダウンストリームの機械学習と分析のための、ペタバイト規模のデータの取り込みに対応できなかったのです。多様な構造化・非構造化データの扱いにも課題がありました。データは急速に変化し続け、さまざまなシステム間で断片化されており、顧客やビジネスの全体像を把握することが困難でした。

膨大な種類のデータソースとデータタイプが存在し、最重要事項であるデータの信頼性とガバナンスの確保もままならない状況でした。店舗やパートナーに正確な洞察をリアルタイムで提供するためにも、履歴データとライブデータを一元化するツールが必要でした。

データをサポートするためのクラスタのプロビジョニングにも問題があり、データエンジニアはクラスタの作成とメンテナンスに多くの時間を費やしていました。データエンジニアリング・分析部門ディレクターのビシュワナート・スブラマニアン(Vishwanath Subramanian)氏は次のように述べています。「私たちのエンジニアリングサービスは最適化されていませんでした。コンピューティングを効率よくスケーリングできず、クラスタのスケーリングには30分以上かかることがよくありました。」

データが、ダウンストリームのデータサイエンスおよび分析チームにたどり着くと、統一性のないユーザーエクスペリエンスがイノベーションの障壁となり、探索、実験、再現性を妨害しました。顧客との有意義なつながりを築くために、こうしたイノベーションに対する障壁を取り除く必要がありました。

単一のデータソースによるMLユースケース

これらの課題を解決するために、スターバックスはAzure Databricks上で統合分析フレームワーク「BrewKit」を開発しました。このフレームワークの目的は、単一のデータソースを確保することで全社的なデータ共有を容易にし、部門間のコラボレーションを促進し、大規模な機械学習によって新たな価値を創出することでした。

「小さな組織でも、大規模なデータサイエンスとデータエンジニアリングを実行できるようにしたかったのです。Databricksのスケーラブルな統合プラットフォームを導入しことで、それを実現できました。」

Azure DatabricksとDelta Lakeを使用することで、データエンジニア部門は、バッチおよびリアルタイムのワークロードを同一プラットフォーム上で実行するパイプラインを構築できるようになりました。これにより、データサイエンス部門は、さまざまなデータセットをブレンドして、顧客エクスペリエンス向上のための新たなモデルのトレーニングを実行できます。特筆すべきは、データ処理能力の大幅な向上により、環境の展開と洞察の抽出が数分という短時間で完了するようになったことです。

データサイエンスの観点のメリットとしては、対話型Notebookを利用することで、ユーザーのオンボーディングが早くなり、コラボレーションが効率化し、さまざまなユースケースの管理が容易なったことが挙げられます。開発したモデルは、MLflowを利用して迅速、簡単にテストできます。「このようなプラットフォームは、データ部門のコラボレーションの生産性を向上させるという点で、非常に重要です。実験とセルフサービスの文化が育まれると同時に、責任も共有しています。」(スブラマニアン氏)

Databricksが支援するデータ駆動型戦略

スターバックスは、Databricksの統合データ分析プラットフォームを中核に据え、データ戦略を変革しました。パイプラインとモデルのデータフローはシームレスになり、新しいアイデアやソリューションを生み出しやすくなりました。DatabricksとDelta Lakeの処理能力とAzureの組み合わせによって性能が50~100倍に向上し、データサイエンスと分析部門へのデータ提供が迅速化しています。

Delta Lakeは、信頼性の高い永続的なストレージレイヤーを提供し、ダウンストリームでのデータ分析のための高品質データを安全に供給します。これにより、ツアーオペレーション、サービス品質分析、需要予測と在庫管理、パーソナライズされたショッピング体験など、数多くの分析ユースケースの探求が可能になります。

「Databricksの導入以来、データ分析に戦略的な視点を取り入れるようになりました。データを有効活用し、バリューチェーン全体に関わるビジネスの問題解決に役立てています。」(スブラマニアン氏)

スブラマニアン氏は、Databricksの導入によって、スターバックが掲げる「世界最高クラスの顧客エクスペリエンス」が実現できると確信しています。「スターバックスでは、データとAIを活用することで顧客とのつながりを強めています。現代のニューノーマルに適応し、配信チャネルを拡大していくために、データは今後も重要な役割を担っていくでしょう。」

  • 1000 以上
    データパイプライン
  • 50~100 倍
    データ処理を 50~100 倍に高速化
  • 15
    機械学習モデルを15分で展開

「Databricksの導入以来、データ分析に戦略的な視点を取り入れるようになりました。データを有効活用し、バリューチェーン全体に関わるビジネスの問題解決に役立てています。」(スブラマニアン氏)

—スターバックス社
データエンジニアリング&分析部門ディレクター
ビシュワナート・スブラマニアン氏

関連リソース

Spark + AI サミット (北米):スターバックスによる大規模な機械学習の運用
Spark + AI サミット (北米) 2020 セッション:ビッグデータパイプラインの大規模な運用

無料お試し・その他のご相談を承っております

Databricks の無料トライアル製品について詳しく見るご相談・お問い合わせ