導入事例
データと機械学習の活用で保険料を最適化

Databricks を利用した数理モデルで保険業務を刷新

業種:保険

ソリューション:予測型分析

ユースケース(技術面):データの取り込み、ETL、機械学習、深層学習

データの可用性が爆発的に増大し、市場競争が激化する昨今では、より的確な保険料を提示することが保険会社にとって大きな課題となっています。米保険ネーションワイド社は、ダウンストリームの機械学習タスクで使用する数億件の保険記録を分析していましたが、既存のバッチ分析プロセスは低速で精度が低く、保険金請求の頻度や重大度を予測するための十分な洞察を得ることが難しい状況でした。Databricksを利用した深層学習モデルを大規模に採用することで、より的確に保険料を予測できるようになり、結果として収益の増大を実現しました。

バッチジョブと手動プロセスによる不正確なモデル

的確な保険料を設定するうえで鍵となるのは、保険金請求に関する情報を十分に活用することです。しかし、保険請求は発生頻度が少なく、変動性が高く予測不能なため、データの分析が困難で、的確な保険料の算出がでませんでした。

  • ビッグデータにおける課題:保険料の設定には、何億もの保険記録を分析する必要があった。また、保険請求は発生頻度が低く、偶発的に発生するため、保険料の的確な設定が困難であった。
  • スケーラビリティの限界:インフラが未整備であったため、各メンバーが個人のワークステーションでの作業を余儀なくされており、予測のための十分なデータ分析ができない状況だった。
  • チームのサイロ化:組織が大規模になり、データアナリスト、データエンジニア、データサイエンティストの相互の連携がうまくできず、データやモデルの共有に支障をきたしていた。

Databricks によるスケーラビリティとイノベーションの促進

ネーションワイド社は、Databricks の統合分析プラットフォームを活用し、データの取り込みから深層学習モデルの展開まで、分析プロセス全体を管理しています。フルマネージド型プラットフォームによって IT 業務が簡素化され、データサイエンスの工程に十分なデータが活用できるようになりました。

  • フルマネージド型プラットフォームとクラスタの自動管理:規模の大小に関わらず、インフラとその運用がシンプルになった。
  • コラボレーションワークスペース:インタラクティブなノートブックにより、チーム間の共同作業とデータサイエンスの創造性が向上。これにより、モデルのプロトタイピングが迅速になり、高速なイテレーションが可能になった。
  • 機械学習ライフサイクルの簡素化:マネージド MLflow により、深層学習(階層型ニューラルネットワーク)のトレーニングおよび実稼働環境への展開がシンプルになった。

深層学習の活用で保険料を最適化

ネーションワイド社は、Databricks をデータエンジニアリングおよびデータサイエンスの工程全体に導入することで、データ処理を高速化し、各ユースケースに最適なモデルの迅速なトレーニングが可能になりました。

  • 大規模なデータ処理:データパイプライン全体のランタイムの性能が9倍向上、これまで 34 時間かかっていたものが 4 時間未満に短縮できた。
  • 特徴量識別の高速化:データエンジニアリングにおいて、特徴量の識別速度が 15 倍になり、これまで 5 時間かかっていたものが 20 分程度に短縮できた。
  • モデルトレーニングの高速化:トレーニング時間が 50% 短縮し、新しいモデルを迅速に実用化できるようになった。
  • モデルスコアリングの高速化:モデルスコアリングが 60 倍高速化、これまで 3 時間かかっていたものが 5 分未満に短縮できた。
  • 9 倍
    データパイプラインの高速化により、ランライムを 34 時間から 4 時間未満に短縮
  • 15 倍
    ダウンストリームの機械学習の特徴量識別を高速化
  • 50%
    機械学習モデルのトレーニングと展開に要する時間を半減

「Databricks の導入により、あらゆるデータに対する適切なモデルを高速にトレーニングできるようになりました。結果としてより的確な保険料の算出が可能になり、収益にも好影響をもたらしています。」

ネーションワイド社
データサイエンティスト ブリン・クラーク氏

関連リソース


テクニカルトーク(Spark + AI Summit NA 2019 より)

無料お試し・その他のご相談を承っております

Databricks の無料トライアル製品について詳しく見るご相談・お問い合わせ