VOGUE、The New Yorker、WIRED など著名な雑誌を発行する米コンデナスト社は、データを駆使することで、印刷物、オンライン媒体、動画、SNS を通じて 10 億人を超える読者にコンテンツを提供しています。しかし、膨大なデータを活用することは容易ではなく、インフラの管理や、データサイエンスの生産性向上に苦心してきました。Databricks が、この問題を解決しました。クラスタを自動化することで DevOps の手間を省き、Delta Lake により、一月当たり 1 兆のデータポイントを処理するデータパイプラインの構築を実現しました。さらに、MLflow との連携によりデータサイエンスのイノベーションを活性化させ、機械学習のライフサイクル全体の管理を可能にしました。これらの実現により、ブランド全体を通じてパーソナライズされたコンテンツを顧客に提供し、顧客の囲い込みと維持率向上に成功しました。
米出版大手のコンデナスト社は、20 を超えるブランドを運営しています。月当たりの Web コンテンツ閲覧者数は1億を超え、ページビューは8億回を超え、膨大なデータが蓄積されていました。データ部門は、機械学習の利用を通じてパーソナライズされたコンテンツ提案とターゲティング広告を配信し、ユーザーエンゲージメントの向上を図りました。しかし、実際にやってみると、いわゆるバニラ状態の Spark を使用してデータプラットフォームを構築することは、困難であることがわかりました。
コンデナスト社は、Databricks の提供する完全管理のクラウドプラットフォームを導入することで、オペレーションの簡素化、性能の向上、データサイエンスのイノベーションを実現しました。
データ分析と機械学習の基盤として Databricks を導入することで、20 を超えるブランドにおいて、顧客に関する新たな洞察を活用した顧客エンゲージメントの強化戦略が可能になりました。
「Databricks は極めて強力なエンドツーエンドのソリューションです。専門分野や経験に関わらず、チーム全員が大規模なデータに素早くアクセスし、実践的な気づきを得られるようになりました。」
コンデナスト AI インフラ部門
プリンシパルエンジニア
ポール・フライゼル氏
テクニカルトーク(Spark + AI Summit EU 2019 より)