Kundenbericht

How AI is changing drug discovery

Millionen

Datenpunkte, die aus Tausenden Quellen verarbeitet wurden

INDUSTRY: Life sciences

SOLUTION: Recommendation engines

PLATFORM USE CASE: Delta Lake, data science, machine learning, ETL

CLOUD: AWS, Azure

Hintergrundbild

“By moving to Databricks, we have seen an order of magnitude improvement in performance.”

— Eliseo Papa, Computational Biologist, AstraZeneca

AstraZeneca erforscht, entwickelt und vermarktet bahnbrechende Medikamente gegen einige der schwerwiegendsten Krankheiten der Welt. Das größte Hindernis für neue Innovationen ist die Unfähigkeit, alle verfügbaren wissenschaftlichen Informationen schneller zu nutzen als die Geschwindigkeit, mit der neue Daten eintreffen. Das Unternehmen brauchte eine Plattform, die es ihm ermöglichte, skalierbare, leistungsstarke Datenpipelines zu erstellen, die in Machine-Learning-Modelle einfließen und so Wissenschaftlern bei gezielten Entscheidungen helfen. Dank Databricks kann AstraZeneca mithilfe von Big Data und Machine Learning eine Empfehlungs-Engine aufbauen, die es Wissenschaftlern einfacher macht, neuartige Medikamente schneller, kostengünstiger und effektiver bereitzustellen.

Zu viele Daten bremsen die Entscheidungsfindung aus

Es ist allgemein bekannt, dass die Erforschung, Entwicklung und Vermarktung neuer Arzneimittelklassen 10 bis 15 Jahre dauern kann und mehr als 5 Milliarden US-Dollar an Forschungs- und Entwicklungsinvestitionen getätigt werden, wobei letztendlich weniger als 5 % der Medikamente auf den Markt kommen. AstraZeneca hat erkannt, dass dieses Innovationstempo nicht ausreicht, und ist zu einem datengesteuerten Ansatz übergegangen, um die Erfolgsquote bei der Erforschung von Medikamenten zu erhöhen und die klinischen Studien sicherer zu verwalten.

Die Wissenschaftler von AstraZeneca waren jedoch immer noch nicht in der Lage, schnell fundierte Entscheidungen zu treffen, obwohl ihnen alle verfügbaren wissenschaftlichen Informationen zur Verfügung standen. Sie hatten Probleme mit Daten, die sich in unzusammenhängenden Quellen sowohl innerhalb des Unternehmens als auch in externen öffentlichen Datenbanken befanden. Da neue wissenschaftliche Forschungsergebnisse weiterhin in rasantem Tempo veröffentlicht werden, wurde es außerdem praktisch unmöglich, über das Tempo der wissenschaftlichen Entdeckungen auf dem Laufenden zu bleiben.

  • Komplexität der Infrastruktur: Ermitteln der Infrastruktur, die Flexibilität ermöglicht, aber keine ständige Wartung erfordert
  • Riesige Mengen unzusammenhängender Daten: Aufgabe der Erfassung und Analyse von Millionen von Datenpunkten in Hunderten von Datenquellen, einschließlich interner Datenquellen und öffentlicher Quellen wie Fachliteratur, öffentlicher Datenbanken usw.
  • Schwierigkeiten bei der Skalierung von Vorgängen zur Unterstützung von Data Science mit Open-Source-Python-Notebooks

Schnellere Datenpipelines beschleunigen ML-Innovationen

AstraZeneca leverages the Databricks Lakehouse Platform to help build a knowledge graph of biological insights and facts. The graph powers a recommendation system which enables any AstraZeneca scientist to generate novel target hypotheses, for any disease, leveraging all of the data available to them.

  • Fully managed platform: Simplified cluster management and maintenance of analytic resources at scale.
  • Aufbau von skalierbaren, leistungsstarken Datenpipelines: diese können NLP in einer riesigen Bibliothek wissenschaftlicher Literatur und Datenquellen für nachgelagerte Analysen nutzen
  • Beschleunigung von Innovationen im Bereich Machine Learning: Data Scientists können Modelle entwickeln und trainieren, die Rankingvorhersagen liefern und ihnen helfen, intelligentere Entscheidungen zu treffen

Transformation der Erforschung von Medikamenten mit KI

Seit der Umstellung auf Databricks ist AstraZeneca in der Lage, Millionen Datenpunkte aus Tausenden von Quellen einfacher zu verarbeiten. Dank der nun möglichen Skalierung konnte AstraZeneca verlässlicher aussagekräftige Erkenntnisse gewinnen. Mit diesen können möglicherweise neuartige Medikamente entwickelt werden, die Menschen dabei helfen, ein gesünderes Leben zu führen.

  • Verbesserte betriebliche Effizienz: Funktionen wie Clusterverwaltung und automatische Skalierung von Clustern haben Betriebsabläufe von der Datenaufnahme bis zur Verwaltung des gesamten Lebenszyklus des Machine Learnings verbessert.
  • Bessere Produktivität in der Datenwissenschaft: Die gemeinsame Notebook-Umgebung mit Unterstützung für mehrere Sprachen hat die Teamproduktivität verbessert.
  • Schnellere Einblicke: Die von Databricks unterstützte Empfehlungs-Engine hat die Fähigkeit von AstraZeneca verbessert, fundiertere Hypothesen aufzustellen, wodurch die Markteinführungszeit für neuartige Medikamente verkürzt werden konnte.