メインコンテンツへジャンプ

フィラデルフィア・ユニオン:生成AIによるメジャーリーグサッカー(MLS)の選手編成計画の効率化

アディソン・ハンシカー(フィラデルフィア・ユニオン)
クリストファー・ニーゼル
Samwel Emmanuel
Share this post

Summary

フィラデルフィア・ユニオンチームは、Databricks Data Intelligence Platformを使用して、MLSロスター管理を簡素化するGenAIチャットボットを実装しました。このユーザーフレンドリーなツールは、ChatGPTのようなインターフェースを通じて複雑なロスタールールと給与規定をナビゲートし、迅速な意思決定を可能にします。チャットボットはロスター規定の即時解釈を提供し、フロントオフィスがMLSガイドラインの遵守を維持しながら戦略的なタスクに集中できるようにします。この革新的なソリューションは、チーム構成の管理における運用を効率化し、効率を向上させます。

メジャーリーグサッカー(MLS)で競争力を維持するためには、戦略的な選手編成計画と効果的な移籍市場の活用により、強力なチームを構築し維持することが求められます。 これを達成するために、MLSのチームは選手構成のルールと規定に依存しています。しかし、これらのルールはしばしば詳細で法的な内容が含まれており、意思決定プロセスを遅らせることがあります。この課題を認識したフィラデルフィア・ユニオンは、2020年のMLSサポーターズ・シールドの受賞者、Databricks Data Intelligence Platformを活用して意思決定を効率化しました。高度なデータとAIの能力を活用して、フロントオフィスが選手構成、給与予算ガイドライン、その他の複雑な規定に関する問い合わせを支援するGenAIチャットボットを導入し、効率性と運用の明確性を向上させました。

 

Databricksを活用することで、我々は選手編成のアプローチを変革し、複雑で時間のかかるプロセスを効率的なデータ駆動型の運用に変えています。
— Addison Hunsicker、シニアマネージャー、サッカー分析、フィラデルフィア・ユニオン

 

このチャットボットは、Databricks Appsを通じてデプロイされたノーコードのChatGPTライクなインターフェースを通じてアクセスされます。これは、データとAIアプリケーションを迅速に構築するためのソリューションです。フロントオフィスは、チャットボットの会話型スタイルから利益を得ており、これにより簡単にアクセスできるだけでなく、選手編成規定のゼロショット解釈も秒単位で可能になります。これにより、意思決定が加速し、貴重な時間が節約され、フロントオフィスはより戦略的で価値を追加するタスクに集中することができます。

MLSロスターのルールと規制

ソリューションアーキテクチャ:迅速なルール解釈のためのRAG

 

このソリューションは、全てのコンポーネントがDatabricksデータインテリジェンスプラットフォームによって完全に動作する、Retrieval-Augmented Generation(RAG)アーキテクチャに基づいて構築されています。RAGは、「外部」のストレージメカニズムから関連するコンテキストを取得し、それをユーザーのクエリプロンプトに追加し、大規模な言語モデルから非常に正確で文脈に適した応答を生成します。

RAGアーキテクチャの例

この場合、ストレージメカニズムはVector SearchというDatabricksが提供するベクトルデータベースです。新しいPDFが自動的に利用可能になるように、選手編成ルールのPDFをDatabricks Volumesにロードするための連続的な取り込みメカニズムが設定されました。これは、Databricks上の半構造化データと非構造化データのための完全に管理されたストアです。次に、テキストが抽出され、Databricks Foundation Model APIからの埋め込みモデルを使用して数値表現(または埋め込み)が生成されます。これらの埋め込みは、Vector Searchによってインデックス化され、提供され、迅速かつ効率的な検索と取得を可能にし、関連情報への迅速なアクセスを可能にします。

PDFルールドキュメンテーション

フィラデルフィア・ユニオンはまた、Databricks自身のDBRX Instructモデル、強力なオープンソースのLLM(Large Language Model)を使用しました。これは、専門家の混合(MoE)アーキテクチャに基づいています。DBRX Instructは、MMLUなどのベンチマークで優れたパフォーマンスを発揮します。便利なことに、このモデルはDatabricks Foundation Model APIを通じても利用可能で、自分たちのモデルインフラストラクチャをホストしたり管理したりする必要がなくなりました。

 

その後、彼らのRAGチャットボットはMosaic AI Agent Frameworkを使用してデプロイされ、RAGアプリケーションコンポーネントをDatabricks Model Servingエンドポイント上のAPIとしてホストできるチェーンにシームレスに組み込むことができます。このフレームワークには、レビューアプリと組み込みの評価が含まれており、これらは人間のフィードバックを収集し、RAGソリューションの効果を検証するために非常に価値がありました。これにより、チャットボットが信頼性があり、最適化されていることが確認されました。

RAGチャットボットスクリーンショット1

ここからは、標準的なDatabricks AppsチャットUIテンプレートをMosaic AI Agent Frameworkエージェントに接続し、数分でチャットボットをデプロイすることが簡単になります。

RAG デプロイメント1RAGデプロイメント2

Databricks RAGソリューションの主な利点

次に、Databricks RAGソリューションが提供する主要な利点と、それを可能にする関連コンポーネントを探ります。

 

  • 迅速なモデル化時間:ユニオンのデータチームは、RAGモデルを数日で開発し、デプロイしました。Mosaic AI Agent Frameworkを活用したエンドツーエンドのLLMOpsワークフローにより、迅速なイテレーション、シームレスなテスト、デプロイメントが可能となり、通常このような複雑なシステムに必要な時間を大幅に短縮しました。
  • 即時の価値実現:RAGシステムを導入することで、チームは以前は時間のかかる手作業だった選手編成ルールの抽出と分析を自動化し、即時の価値を実現し始めました。
  • 強化されたデータ管理とガバナンス: Databricks Unity Catalogは、選手と編成情報の安全で規制に準拠した取り扱いを確保しつつ、企業のガバナンス基準を維持するための堅牢なデータ管理とガバナンスを提供しました。
  • スケーラビリティとパフォーマンス: Databricksプラットフォームの大量のデータを効率的に処理する能力により、ユニオンは現在の選手編成ルールだけでなく、過去のトレンドや将来のシナリオも大規模に分析することができました。
  • 柔軟で高品質なAI開発: チームはMosaic AI Agent Frameworkを活用することで、RAGモデルのライフサイクルを効率化しました。トレースログの記録、フィードバックのキャプチャ、パフォーマンスの評価などの機能により、品質の継続的な改善と微調整が可能になりました。さらに、MLflowの統合により、さまざまなRAG設定の実験が簡単になり、最適なパフォーマンスを確保しました。
  • ガバナンス、セキュリティ、効率的なデプロイメント: Mosaic AIエージェントフレームワークのDatabricksデータインテリジェンスプラットフォームとの統合により、すべてのデプロイメントがガバナンスとセキュリティの基準を満たし、AIソリューションの信頼性とコンプライアンスを確保する環境が実現しました。

 

まとめ

Databricksはフィラデルフィア・ユニオンの12番目の選手となり、彼らを前向きでデータ駆動型の組織に変えるのを助けています。スポーツ業界が進化を続ける中で、フィラデルフィア・ユニオンが先進的な分析とAIを採用したことは、データインテリジェンスがピッチ上でもオフでもゲームチェンジャーになり得ることを示しています。

 

ユニオンの技術の革新的な使用は、MLSチーム構成ルールの遵守を確保するだけでなく、選手の獲得と開発における競争優位性を提供します。Databricksを使えば、ユニオンはMLS規制の複雑さをナビゲートしながら、最も重要なこと - 勝利するチームを作ることに集中することができます。GG!

 

このブログ投稿は、共同で執筆されました Addison Hunsicker (フィラデルフィア・ユニオン)、Christopher Niesel (Databricks) そして Samwel Emmanuel (Databricks) によって。

Databricks 無料トライアル

関連記事

Cracking the Code: Databricksがバイオメカニクスデータでメジャーリーグを再構築する方法

November 1, 2023 Harrison FlaxChris NieselHussain Vahanvaty による投稿 in
翻訳:Saki Kitaoka. - Original Blog Link バイオメカニカルデータは、メジャーリーグ(MLB)のチームにとって、選手のパフォーマンスを向上させ、怪我を減らすという競争上の優位性を提供する、ゲームを変える要素として登場しました。しかし、その潜在的な可能性にもかかわらず、ほとんどのチームはその能力を十分に活用できずにいます。 バイオメカニクスデータのソースは、ウェアラブルセンサー、フォースプレート、モバイルデバイス、そして特に高速度カメラなど多岐にわたります。2020年、各球場に12台のカメラを戦略的に配置した Hawk-Eye Statcastシステム の登場は、大きな前進でした。これらのカメラのうち5台は投球と打撃専用で、毎秒100フレーム(FPS)で作動。残りの7台のカメラは、フィールドプレーヤーと打球に焦点を当て、50 FPSでデータを取得します。これらのカメラシステムを合計すると、MLBのレギュラーシーズン2,430試合ごとに24テラバイトという途方もない量のデータが生成され
生成 AI一覧へ