ディープラーニングによるパーソナライズされたホテル推薦
Hotels.com は、オンラインで宿泊施設を予約できる優れた Web サイトです。約19,000の地域に位置する 325,000軒以上のホテルを掲載しており、41カ国語で90のウェブサイトを運営しています。旅行予約アプリは7,000万回以上ダウンロードされており、世界中の旅行者が滞在に最適な場所を見つけるのをサポートしています。
課題
課題
Hotels.com は、同社のウェブサイトで325,000以上のホテルの何百万もの写真をホストしています。毎日、何千もの新しい写真がホテルおよび顧客によってアップロードされています。これらの写真は、重複や低品質の画像を避けるために迅速に分析し、論理 的に並べ替えられるよう分類する必要があります(例:キッチン、プール、ジムなど)。最後に、顧客がサイトを検索するとき、顧客が自分のニーズに最適なホテルを見つけられるように、おすすめのホテルをパーソナライズする必要があります。これを実現するためには、膨大な計算能力と高度な分析が必要です。
-
機械学習を活用した顧客体験の促進:各宿泊先に対応する画像ファイルが大量に重複しており、ランク付けと分類が乱雑な状態になっていました。機械学習/深層学習モデルの本番環境へのデプロイでは、リアルタイムのスコアリングを構築し、効率化する必要がありました。
-
データパイプラインの強化と高速化:SQL と SAS を使用しているオンプレミスの Hadoop cluster では、大規模な data science を実行するのに時間がかかり、制限がありました(データのわずか 10% をデータパイプラインで処理するのに 2 時間必要)。
-
顧客のコンバージョン数の増加: リアルタイムで顧客のトレンドを把握し、コンバージョン率とライフタイムバリューを高めるための戦略を立てられるようになることが目標でした。
ソリューション
ソリューション
Databricks は、顧客の行動を予測し最適化されたユーザー体験を提供できるよう、「data science に重点を置く」という Hotels.com の目標を支援しました。
-
cluster 管理: インフラストラクチャをさらに複雑にすることなく、データ量を大幅に拡張できます。
-
インタラクティブなワークスペース:Hotels.com 内の data science チームおよび、Expedia 内のその他の事業部門間のコラボレーションの文化を促進します。
-
Databricks のランタイム:大規模なストリーミングデータであっても処理性能を向上させます。
「敏捷性と柔軟性は、data science とエンジニアリングの目標をサポートするために欠かせないものでした。ワークフローを 100% 実行するため Databricks の統合分析プラットフォームに移行したことで、当社のビジネスとお客様に多大なメリットが創出されました」
マット・フライヤー
Hotels.com の VP 兼最高 Data Science 責任者
結果
- 大規模な ETL の加速:パフォーマンスに影響を与えることなく、データ処理量を 20 倍に増やすことが可能です。
- 最適化されたユーザー体験:顧客によるプロパティ検索のコンテキスト内で、高精度かつ効果的な画像を表示します。
- 販売効率の強化:検索結果に基づいた適切なホテルと適切な画像表示が、コンバージョン率の向上につながっています。