機械学習の活用で モバイルバンキングを刷新
複雑な分析処理が 6 時間から 6 秒に短縮
14 個のデータベースを 1 つの Delta Lake に置き換え
PayMe アプリの顧客エンゲージメントの向上率
世界有数の国際的な金融機関である HSBC は、モバイルデバイスでの電子決済に新たな管理方法を導入し、この分野を牽引しています。人気のソーシャルアプリ PayMe は、利用者同士でのキャッシュレス取引を即時かつセキュアに行うことを目的として HSBC が開発したものです。HSBC は、3,900 万人以上もの顧客にサービスを提供するうえで、スケーラビリティの限界に直面するようになり、そのことがデータ駆動型の意思決定を妨げていました。HSBC は、Databricks の導入により、データ分析と機械学習のスケーリングが可能になり、パーソナライゼーション、レコメンデーション、ネットワークサイエンス、不正検出など、顧客中心のユースケースに対応できるようになりました。
データサイエンスとデータエンジニアリングにデータを有効活用できていなかった
HSBC は、データと分析を有効活用することで、3,900 万人以上の顧客に対してよりよいサービスを提供できることを認識していました。そこで、電子決済に新たな可能性を見出し、ソーシャルアプリの PayMe を開発しました。PayMe は、HSBC の最大の市場である香港での発表以来、180 万 人以上のユーザーを獲得し、同地域でナンバーワンのアプリとなっています。
急速に成長している顧客基盤に可能な限り最高のモバイル決済のエクスペリエンスを提供するために、HSBC はデータと機械学習を活用し、不正行為の検出、マーケティングの意思決定を支援する Customer 360、パーソナライゼーションなど、さまざまなユースケースを展開しています。しかし、これらのユースケースをセキュアで高速、かつスケーラブルな方法で実現できるモデルを構築することは簡単ではありませんでした。
-
データパイプラインが低速なため処理に時間がかかる:従来のシステムは、データを大規模に処理、分析する能力が欠けており、データのエクスポートやサンプル作成は手作業で行う必要があったため、時間がかかっていた。データサイエンス部門にそのデータが届いたときには、すでに数週間前の古いデータになっており、予測能力を妨げていた。
-
手作業によるデータのエクスポートとマスキング:従来のプロセスでは、データリクエストごとに手作業で承認フォームに入力する必要があり、エラーが発生しやすかった。さらに、手作業でのマスキング処理は時間がかかるだけでなく、厳格なデータ品質や保護ルールも守られていなかった。
-
非効率的なデータサイエンス:データサイエンティストは、独自のマシンやカスタム環境で作業していたためサイロ化が常態化しており、生データの探索や大規模なモデルのトレーニングが制限されていた。そのため、コラボレーションが不十分で、モデルの反復も非常に遅かった。
-
データアナリストがデータを有効活用できていなかった:ビジネスインテリジェンスやレポート作成のためには構造化データのサブセットにアクセスする必要があった。
分析と機械学習を大規模に展開 ― より高速かつセキュアに
HSBC は、NLP と機械学習を利用することで、PayMe アプリの各取引に付随する情報を迅速に把握できるようになりました。このような幅広い情報は、顧客への推奨事項から異常な行為の抑制まで、さまざまなユースケースに対応するために利用されます。
HSBC は、Azure で Databricks を利用することで、エンジニアリング、サイエンス、分析の各データ部門を横断したデータ分析の一元化を実現しています。
-
運用効率の改善:クラスタの自動スケーリングや Delta Lake のサポートなどの機能により、データの取り込みから機械学習のライフサイクル全体の管理に至るまで、運用効率が大幅に改善。
-
Delta Lakeによるリアルタイムでのデータマスキング:Databricks と Delta Lake を使用することで、匿名化された生産データをデータサイエンスとデータ分析の両部門にリアルタイムでセキュアに提供可能。
-
Delta Lake による高性能でスケーラブルなデータパイプライン:ダウンストリーム分析や機械学習のためのリアルタイムでのデータ処理が可能。
-
部門間のコラボレーション:データサイエンス部門とデータエンジニアリング部門の共同作業により、迅速なデータ検出、反復的な機能エンジニアリング、迅速なモデル開発やトレーニングを実現。
ナンバーワンのアプリを支える豊かな洞察
Databricks は、データエンジニアリングからより豊かなビジネスの洞察を提供する機械学習モデルの生成まで、HSBC の分析プロセスのあらゆる面を一元化する統合データ分析プラットフォームを提供しています。
-
データパイプラインの高速化:プロセスの自動化とデータ処理量の向上により、複雑な分析の処理時間を6時間から 6 秒に短縮。
-
予測モデルに対応:データセット全体に対してモデルをトレーニングできるため、さまざまなユースケースに対応した予測モデルを展開可能。
-
14 個のデータベースを 1 つの Delta Lake に統合:14 個の読み取りレプリカデータベースを、Delta Lake による単一の統合データストアに移行。
-
PayMe の成功:香港市場でシェア 60% を獲得し、最も人気のあるアプリとなった。
-
顧客エンゲージメントの向上:顧客とのつながりを理解するためにネットワークサイエンスを活用することで、PayMe アプリのエンゲージメントレベルが 4.5 倍向上。