翻訳:Junichi Maruyama. Original Blogはこちら
毎年恒例のData Team Awardsは、さまざまな企業のデータチームが、世界で最も困難な問題に対してどのようなソリューションを提供しているかを紹介するものです。
6つのカテゴリーにおいて、さまざまな業種や地域の企業から300近い候補が提出されました。これらの組織はそれぞれ、データとAIの活用において顕著な革新性を示しており、私たちはこれらのストーリーを伝える手助けをしたいと考えています。Data and AI Summitの開催を間近に控え、各カテゴリーのファイナリストを順次紹介していきます。
Data Team for Good Awardは、ヘルスケアからサステナビリティまで、グローバルな課題に対するソリューションを提供し、世界にポジティブなインパクトを与えているデータチームに敬意を表します。
以下は、2023年のData Team for Good Awardの候補者です:
Australian Red Cross Lifeblood
オーストラリア赤十字のLifebloodは、人命救助は生物学的製剤へのアクセスを容易にすることから始まることを知っており、生命を与える寄付は、オーストラリアの最も弱い立場の人々の人生を変える結果を可能にします。同社のパフォーマンス&アナリティクスチームは、データとAIを活用して、新規寄付者の募集、既存寄付者の認知、サプライチェーンの最適化により、エンゲージメントを強化し、コミュニティをサポートしています。Databricks Lakehouseを活用することで、Lifebloodは効率的にきめ細かく正確な予測を実行し、地域のダイナミクスを理解することができます。例えば、ドナーセンターでリアルタイムにデータを処理することで、待ち時間やキャンセルを予測し、ドナーに予約の遅れの可能性を警告することができます。また、複雑なセグメンテーションやマーケティングのアトリビューションモデルを通じて、地域の寄付の原動力や、寄付頻度を高める寄付者のギフトについて理解する機会を探しています。Databricks Lakehouseの統一アーキテクチャにより、Lifebloodはより寛大な寄付者を集め、コミュニティ内の絆を強化することが容易になり、その過程で数え切れないほどの命を救うことができるようになりました。
BlueConduit
米国では、飲料水を鉛のサービスラインに依存している家庭が約600万から1000万世帯あると言われています。しかし、これらの家庭の正確な数や位置は不明なままです。Databricks LakehouseはBlueConduit社にとって強力なツールであり、鉛製給水管を迅速かつ効率的に特定し、その交換に必要な基盤を構築するための手段を提供します。Databricks LakehouseはBlueConduitに統一的なアーキテクチャを提供し、歴史的な記録、ゾーニングや不動産情報、水のサンプリングデータ、インフラ情報、人口統計などの異種ソースを統合して、鉛にさらされる可能性が最も高い水道管をMLを使って予測できるようにします。さらに、データエンジニアリング、MLOps、ジョブオーケストレーションなどのプラットフォーム機能により、Infrastructure-as-Codeパターンと容易に統合できるため、BlueConduitは高品質のLSL決定インテリジェンスをスケーラブルに自治体に提供できるようになりました。BlueConduitの予測モデリング技術の効果は、デトロイト市で実証されており、同市は鉛管の捜索で数百万ドルの節約を見込んでいます。現在までに、BlueConduitは500万人以上の人々にサービスを提供する200万本以上のサービスラインをインベントリ化しました。Databricks Lakehouseの統合は、BlueConduitにとって画期的なことであり、その影響力を増幅させ、鉛管という課題への取り組みに大きな進展をもたらすことが証明されています。
CareSource
米国の疎外されたコミュニティが多くの分野で劣悪な健康上の成果を上げ続けていることはよく知られており、特に出産に関しては、その傾向が顕著です。CareSourceのデータチームは、Databricks Lakehouse Platformを使用して競技場を平らにし、データとAIを使用して危険因子を合併症になる前に検出することによって、これらの格差をなくしています。ハイリスク妊娠は、健康歴だけでなく社会経済的な決定要因にも影響される多面的な問題ですが、CareSourceは、機械学習(ML)モデルのトレーニングにデータ全体を使用できないという課題に取り組んできました。ML実験の追跡やモデルの更新ができないことに加え、CareSourceは時間的な制約があるリスク予測の送信を妨げられていました。Feature Store、MLflow、Stacks(現在プライベートプレビュー中)などのサービスを組み合わせることで、6週間で再現可能なエンドツーエンドのMLフレームワークを構築し、母親とそのケアプロバイダーが最も影響のある時に結果を受け取れるよう、時間的な制約がある産科リスクを予測するモデルを提供しました。この産科ハイリスクモデルは、CareSourceにとって始まりに過ぎません。CareSource社は、これまで専門的な生産ソリューションを必要としていた他のユースケースにも、この同じ繰り返し可能な開発から生産までのMLワークフローを使用することを計画しています。
Inari Agriculture
イナリは、種子の可能性を最大限に引き出すことで、より持続可能な世界の食糧システムを構築することに専念しています。同社はSEEDesign™テクノロジープラットフォームを通じて、AIを活用した予測設計と広範な多重遺伝子編集ツールボックスを組み合わせ、人口、地球、食料を育てる人々に利益をもたらす重要なソリューションを推進しています。イナリが目的を達成するために不可欠なのは、どの場所でどの遺伝子編集を行えば最大の効果が得られるかを正確に理解する能力です。Databricks LakehouseとML Flowを基盤インフラとして、稲荷のデータチームはすべての遺伝子データと環境データの統合に取り組み、20分以内にMLモデルに供給するデータパイプラインを走らせています。機械学習は、希少な変異体、遺伝子の機能、遺伝子と表現型の関係を特定するのに役立つ洞察を抽出するために使用され、稲荷は、大幅に少ないリソースでより多くの収穫をもたらす種子を開発するというミッションを前進させています。データとAIの力で、イナリは、地球を守り、増え続ける世界人口に対応するために、前例のない環境的な食糧問題に対処する道を切り開くために、ユニークな立場にあります。
McKesson/Ontada
Ontada は、患者の生活を改善し、がんとの闘いを変革することを目的とした腫瘍学データ、研究、テクノロジー事業を展開しています。Databricks Lakehouse Platformは、Ontadaのディープラーニング 自然言語処理(NLP)モデルとアルゴリズムを強化し、計算効率を向上させ、アルゴリズムの有効性と正確性を向上させます。Databricks Lakehouse Platformにより、Ontadaは何百万もの非構造化医療文書を迅速に取り込み、処理することができるようになりました。その一例として、非構造化メモからのバイオマーカーデータの抽出を高速化する機能があります。バイオマーカー情報へのアクセスと精度は、医師が患者さんに標的療法を提供し、精密医療を活用し、最終的に患者さんのがん治療の成果を向上させるために不可欠であるため、これは重要です。 当社のデータサイエンスと研究の専門知識をデータブリックのデータプラットフォームアーキテクチャと組み合わせることで、高品質の結果を確保しながら臨床的洞察へのスピードを拡大・加速し、それによってオンタダの差別化とデータ価値提供の礎として機能することができるのです。
6月27日18:00からEXPOシアターで開催される「Data and AI Summit」にて、各部門の受賞者を発表する予定です。その場で皆さんと一緒に、素晴らしいデータチームをお祝いできることを楽しみにしています。