メインコンテンツへジャンプ

NHLチーム向けマネージドSportlogiqからDatabricksへのデータ取り込みパイプライン:ゲームを変えるアライアンス

エドワード・エドワードワース
コナー・ベイリー
サムウェル・エマニュエル
Share this post

概要

競争の激しいプロホッケーの世界では、NHLチームは常にパフォーマンスの最適化を追求しています。 高度なアナリティクスは、この追求においてますます重要になっています。 サードパーティのデータベンダーは、大量の生データやビデオ映像を処理するために、コンピュータビジョンや機械学習などの最先端技術を採用しています。 その目的は、各試合から詳細な洞察を引き出すことです。 こうした細部を総合的に分析することが、勝敗を分けることも少なくありません。

この分野で注目すべきベンダーのひとつが、モントリオールに本社を置くSportlogiq社です。 特許を取得したコンピュータービジョンと機械学習技術を活用し、通常は人間の観察範囲を超えるようなデータを取得・分析します。 Sportlogiqは、スポーツチームやリーグ、メディア、パフォーマンス向上企業など、NHLのさまざまな事業体に包括的な分析サービスとトラッキングデータを提供しています。

しかし、NHLチームがSQL分析を実施し、プレッシャー下での選手の意思決定能力など、特殊な測定基準で機械学習モデルを実行するには、Sportlogiqのゲームイベントデータを他の関連データセットと統合する必要があります。 これには、SMTのようなベンダーの選手とパックのトラッキングデータ、RinkNetのスカウティング情報、EliteProspectsのチームとリーグのランキング、CapFriendlyのサラリーキャップの詳細などが含まれます。 このような多様なデータを効果的に統合し、操作するためには、汎用性が高いだけでなく、シンプルさ、拡張性、コラボレーション機能を重視したデータ分析プラットフォームが必要です。

スポーツのためのDatabricks - スポーツアーキテクチャ(NHL)

このブログでは、DatabricksがSportlogiqおよびKoantekと協力して、自動化され管理されたデータ取り込みパイプラインを開発した方法について説明します。 このパイプラインは、Sportlogiqのデータを、NHLチームが所有する他の関連データとシームレスに取り込み、統合するように設計されています。 このコラボレーションにより、SportlogiqのデータはDatabricks上でよりアクセスしやすく、使いやすくなり、NHLチームはこの豊富な情報を簡単に活用できるようになります。 Sportlogiqのデータ、Databricksのプラットフォーム機能、Koantekの運営ノウハウのユニークな組み合わせは、スポーツアナリティクスの画期的な進歩を意味します。 NHLチームは、データ主導の洞察を活用することで、他に類を見ない競争上の優位性を得ることができます。

データ主導の洞察

課題

NHLのほぼすべてのチームが、試合イベントデータやさまざまなホッケー分析サービスのためにSportlogiqに加入しています。 ほとんどのチームは、Sportlogiqのウェブサイト(iCE)を通じて、このデータと付随するビデオにアクセスします。 技術的に熟練したチームはさらに一歩進んで、Sportlogiq APIを使用して、このデータを独自の分析環境に取り込みます。 これにより、独自のデータとAIによる洞察を生み出すことができます。 チームには、単にライバルと歩調を合わせる以上の大きなチャンスがあります。 このデータを十分に活用することで、差別化を図り、ゲーム内分析とパフォーマンスの新たな基準を打ち立てることができます。 しかし、チームがこのデータを最大限に活用するには、いくつかの障壁があります。

  1. 限られたリソースと専門知識:多くのチームが、リソースや専門知識の不足による課題に直面しています。 これには、データエンジニアリング、プラットフォーム管理、データサイエンス、高度分析のスキル不足が含まれます。 こうした制約が、複雑なデータ分析環境を開発し、維持する能力の妨げとなっています。
  2. 帯域幅と時間の制約:ある程度の能力を持つチームであっても、帯域幅の制限や時間的制約の問題に直面することはよくあります。 テンポが速く要求の厳しいプロスポーツの世界では、データパイプラインを開発・維持するための時間と集中力を確保することは困難です。 これらの仕事は、チーム内の他の重要な活動と競合することがよくあります。
  3. 堅牢なデータプラットフォームの欠如:チームによっては、高度なアナリティクスに必要なスキルと意欲があっても、データを効果的に処理・分析するための適切なプラットフォームがありません。 堅牢で統合されたデータとAIのプラットフォームがなければ、Sportlogiqのデータや他の同様のデータソースの可能性を完全に引き出すことはできません。

ソリューション

KoantekとDatabricksは、Data & AIの旅のあらゆる段階でチームを支援するために設計された包括的なソリューションを開発しました。 このソリューションは、上記の障壁を克服するためのものです。

Koantekのソリューションの主な提供:

毎晩更新可能でメンテナンス可能なパイプライン:KoantekのパイプラインはSportlogiq APIを利用しており、チームはすべてのデータをDatabricksにインポートすることも、必要な特定のサブセットだけをインポートすることもできます。 これにより、チームは分析および意思決定プロセスのために最新のデータにアクセスできるようになります。 このシステムでは、手動で更新する必要がないため、データの遅延やエラーの可能性が大幅に低くなります。

日々の充実 - SportlogiQ

SQL分析用データモデル:Koantekは、SQLアナリティクス用に設計されたLakehouse上のデータモデルをあらかじめ提供しています。 このモデルにより、アナリストはETL(抽出、変換、ロード)プロセスの複雑さやデータ取り込みの難しさをナビゲートする必要なく、すぐにデータのクエリや分析を開始することができます。 このデータモデル内のテーブルは、Databricks Unity Catalogを通じて適切に管理されているため、発見、文書化、セキュリティ、およびデータ系統の追跡が容易です。

SQLアナリティクスのためのデータモデル

ML用特徴量ストアテーブル:Sportlogiqのデータは、同様にAIモデルの訓練と構築に利用できます。 データサイエンティストは通常、データ準備と特徴量エンジニアリングにかなりの(時には法外な)時間を費やします。 Koantekのソリューションは、NHLデータサイエンスチームのAIモデルが繰り返し利用する可能性が最も高い方法でデータを構造化し、準備する特徴量ストアテーブルを事前に提供します。 例えば、ポジション別やシフト別の選手指標、試合別のチーム成績などです。 既存の特徴量テーブルを使用することで、チームはAI/MLにおけるこれらの前段階を回避することができ、データサイエンティストは高度な機械学習モデルと洞察の作成に集中することができます。

ML用フィーチャーストアテーブル

Databricks Lakehouseビルドアウト:まだDatabricksを使用していないチームには、KoantekがLakehouseのセットアップとオンボードへの誘導を行います。 これには、ソース管理、継続的インテグレーションと継続的デプロイメント(CI/CD)、Infrastructure as Code(IaC)、Databricks Asset Bundles(DAB)を使用した自動化などのベストプラクティスに従って、チームがLakehouseプラットフォームを構築できるようにする包括的なエンドツーエンドのソリューションを提供するSportlogiqパイプラインのセットアップが含まれます。

カスタマイズとサポート:カスタマイズ、パーソナライズ、継続的なサポートが含まれます。 NHLの各チームには独自のニーズと戦術があることを認識し、Koantekはチームと緊密に連携してデータパイプラインをカスタマイズし、各チームの特定の要求に応える新しい分析およびAIのユースケースを構築しています。 このカスタマイズされたアプローチにより、チームはデータ分析の取り組みから最大限の利益を得ることができます。

データブリック・レイクハウス

容易な統合と利用:Koantekのサービスの核心は、NHLチームのための高度なデータ分析の簡素化です。 Koantekは、複雑なデータパイプラインの管理とDatabricksとの統合を管理し、チームのパフォーマンスと戦略を向上させるためのデータ分析というチームの強みに集中できるようにします。

NHLチームへの影響

このソリューションは、NHLチームに、試合戦略、選手育成、試合準備、スカウティングへのアプローチを変革する、さまざまな強力な機会を提供します。 これらの機会には以下が含まれます:

  1. ゲーム分析の向上:
    • データ主導のゲーム戦略:Koantekのマネージドデータモデルから得られる洞察を活用することで、チームは統計分析と予測モデリングに基づいた優れたゲーム戦略を構築することができ、競合他社よりも優位に立つことができます。
    • リアルタイムの戦術調整:高度なアナリティクスの統合により、チームはライン変更やショットの質の評価などの戦術について、より的確な情報に基づいた意思決定を行うことができます。 その結果、刻々と変化する氷上の力学に素早く適応し、勝利の可能性を高めることができます。
    • 試合後の詳細な分析:詳細な分析により、各試合の結果をより深く理解することができ、チームは試合後の徹底的なレビューと継続的な改善を行うことができます。
  2. 選手育成とパフォーマンスの向上
    • パーソナライズされたトレーニングプログラム:詳細なアナリティクスを活用することで、各選手の長所と短所に合わせたカスタマイズされたトレーニングプログラムを開発することができます。 このアプローチは全体的なパフォーマンスの向上につながります。
    • 傷害の予防と管理高度なデータ分析により、潜在的な怪我のリスクを特定します。 これにより、チームは傷害予防のための効果的な戦略を導入し、選手の健康と寿命を最適化することができます。
  3. 効率的なスカウトとリクルート:
    • データ主導の選手評価:選手の詳細なパフォーマンスデータを分析できるため、スカウティングのプロセスが簡素化されます。 これにより、チームは戦略的要件に最も合致する選手を特定し、採用することができます。
    • 対戦相手の分析:高度な分析により、対戦相手の戦略や弱点に関する洞察を提供します。 これにより、チームは試合中にこれらの側面を利用するために必要な知識を身につけることができます。

将来のビジョン

Sportlogiqデータと追加ソースの組み合わせ:

  • 複数のデータソースの統合:NHL チームが幅広いデータソースを利用していることを理解しているKoantekは、さまざまなプロバイダーからのデータを取り込み、同期するために、マネージドデータパイプラインを拡張することを想定しています。 この包括的なアプローチにより、チームは従来の統計と高度な指標を融合させた、より広範なアナリティクスの展望にアクセスできるようになります。
  • 統合分析プラットフォーム:Koantekは、多数のデータストリームをDatabricks Lakehouseに統合し、統合分析プラットフォームの確立を目指しています。 このプラットフォームは、これまでデータが細分化されていたために到達できなかった相関関係や洞察を明らかにし、より複雑で戦略的な意思決定プロセスを促進します。

NHLを超えて:他のスポーツリーグへの適応

  • 様々なスポーツのためのカスタマイズされたソリューション:Koantekの革新的なアプローチは、ホッケーだけにとどまりません。 同社は、マネージドデータパイプラインソリューションを他のスポーツリーグにも適応させる予定です。
  • グローバルスポーツ分析革命:この拡張は、世界中の様々なスポーツのチームに力を与え、スポーツアナリティクスの新時代を告げるものです。 この時代には、データ主導の意思決定が標準となり、パフォーマンス、戦略、ファンエンゲージメントが大幅に強化されます。

結論

Databricks上のKoantekのマネージドデータパイプラインにより、NHLチームはデータパイプラインのインフラへの多額の投資を回避することができます。 その代わりに、チームのパフォーマンスを高めるためにSportlogiqのデータを活用することに集中することができます。 このパートナーシップは、データがゲーム戦略の重要な要素として登場するスポーツ分析の新時代を意味します。 さらにエキサイティングなのは、このパイプラインを有効にして、Sportlogiqデータの継続的なストリームをDatabricksワークスペースに流し、さらなる分析を行うことができることです! では、なぜ待つのですか? Databricksデータインテリジェンスプラットフォームでスポーツ分析の未来に参加しませんか。

Databricksのスポーツチームへのお問い合わせは、Harrison Flaxまでご連絡ください。 NHL Sportlogiqデータパイプラインのご利用をご希望の方は、Edward Edgeworthまでご連絡ください。

Databricks 無料トライアル

関連記事

Cracking the Code: Databricksがバイオメカニクスデータでメジャーリーグを再構築する方法

November 1, 2023 Harrison FlaxChris NieselHussain Vahanvaty による投稿 in
翻訳:Saki Kitaoka. - Original Blog Link バイオメカニカルデータは、メジャーリーグ(MLB)のチームにとって、選手のパフォーマンスを向上させ、怪我を減らすという競争上の優位性を提供する、ゲームを変える要素として登場しました。しかし、その潜在的な可能性にもかかわらず、ほとんどのチームはその能力を十分に活用できずにいます。 バイオメカニクスデータのソースは、ウェアラブルセンサー、フォースプレート、モバイルデバイス、そして特に高速度カメラなど多岐にわたります。2020年、各球場に12台のカメラを戦略的に配置した Hawk-Eye Statcastシステム の登場は、大きな前進でした。これらのカメラのうち5台は投球と打撃専用で、毎秒100フレーム(FPS)で作動。残りの7台のカメラは、フィールドプレーヤーと打球に焦点を当て、50 FPSでデータを取得します。これらのカメラシステムを合計すると、MLBのレギュラーシーズン2,430試合ごとに24テラバイトという途方もない量のデータが生成され
業界一覧へ