Deep Learning mit Databricks

Komplexe Daten, gewaltige Möglichkeiten

Sollen Prognoseanalysen von Big Data durchgeführt werden, ist Deep Learning der richtige Weg. Denn Volumen und Komplexität der zu bearbeitenden Daten steigen stetig, was den Rückgriff auf höhere Rechenleistung und bessere Grafikprozessoren zu einer Notwendigkeit macht.

Mit Deep Learning können Unternehmen sich die Vorteile unstrukturierter Daten – von Bildern, über Texte, bis hin zu Sprachaufzeichnungen – für transformative Anwendungsfälle zu Nutze machen. Diese Anwendungsfälle können dann auf spezielle Techniken, wie KI, Bildauswertung, automatische Übersetzung und natürliche Sprachverarbeitung, zurückgreifen.

Verbreitete Anwendungsfälle

BILDKLASSIFIZIERUNG
Bilderkennung und Bildkategorisierung, um die Bildsortierung zu vereinfachen und genauere Suchen zu ermöglichen.
OBJEKTERKENNUNG
Schnelle Objekterkennung, um autonomes Fahren und Gesichtserkennung endlich Realität werden lassen zu können.
NATÜRLICHE SPRACHVERARBEITUNG
Treffsicheres Verstehen gesprochener Wörter, um die Anwendung neuer Tools, wie Speech-to-Text und Home Automation, verbessern zu können.

Die Herausforderungen des Deep Learning

Big Data mag über großes Potenzial verfügen, doch ist es keine einfache Aufgabe, aus riesigen Datenmengen tatsächlich prozessfähige Erkenntnisse zu gewinnen. Um die große und rasant wachsenden Menge an Informationen, die sich in unstrukturierten Daten (in Bild, Ton, Text, usw.) verbirgt, aufarbeiten zu können, müssen innovative Technologien und interdisziplinär zusammenarbeitende Teams – von Data Engineering, über Data Science, bis hin zu Business Analytics – zur Anwendung gebracht werden.

UNZUSAMMENHÄNGENDE TECHNOLOGIEN
Die Abhängigkeit von separaten Frameworks und Tools (wie TensorFlow, Keras, PyTorch, MXNet, Caffe, CNTK und Theano) bringt Low-Level-APIs mit steilen Lernkurven mit sich.
KOSTSPIELIGE INFRASTRUKTUR
Eine speziell für Deep Learning-Prozesse angelegte Infrastruktur kommt nicht ohne erhebliche Mengen an Ressourcen und Rechenleistung aus und ist dementsprechend mit erheblichen Kosten verbunden.
DATA SCIENCE-KOMPLEXITÄT
Ein Deep Learning-Modell manuell zu trainieren kann für Data Scientists leicht zu einer aufwendigen Angelegenheit werden. Nicht selten ist es erforderlich, Daten zu labeln und Parameter abzustimmen.

Deep Learning demokratisieren

Die Unified Analytics-Plattform von Databricks, ausgerüstet mit Apache Spark™, ermöglicht es Ihnen, zuverlässige, leistungsstarke und skalierbare Deep-Learning-Pipelines zu errichten. Unter Zuhilfenahme dieser Pipelines können Ihre Data Scientists dann mühelos Deep-Learning-Anwendungen entwickeln, trainieren und bereitstellen.

EINHEITLICHE INFRASTRUKTUR
Die vollständig verwaltete, serverlose Cloud-Infrastruktur vereint die Vorteile von Isolation, Kostenkontrolle und Flexibilität. Sie bietet eine interaktive Umgebung für eine unkomplizierte Nutzung der gängigen Frameworks, wie TensorFlow, Keras, PyTorch, MXNet, Caffe, CNTK und Theano.
END-TO-END WORKFLOWS
Nutzen Sie eine einzige Plattform zur Vorbereitung und Untersuchung von Daten, zum Training von Modellen, sowie für großangelegte Vorhersagen. High-Level-APIs und Beispielanwendungen lassen Sie Ihre hochmodernen Modelle mühelos zum Einsatz bringen.
OPTIMIERTE PERFORMANCE
Eine hochleistungsfähige Databricks Runtime, ausgerüstet mit Apache Spark, wurde konstruiert, um auf leistungsstarker GPU-Hardware jeden Maßstabs laufen zu können.
INTERAKTIVE DATA SCIENCE
Arbeiten Sie mit Ihrem Team – in unterschiedlichen Programmiersprachen – zusammen, um Daten zu untersuchen und Deep-Learning-Modelle mit Echtzeit-Datensätzen zu trainieren.

Kunden-Anwendungsfälle

Hotels.com klassifiziert Bilder, um deren Enagement Rates und Conversion Rates anzuheben. So kann es die Verarbeitungskapazität um 2000 Prozent erhöhen und gleichzeitig 100 Prozent seiner Datensätze modellieren. Video

Giphy nutzt Databricks zum Vergleich von Millionen von GIFs. So kann es unterschiedliche Bildeigenschaften, wie Szenen, Label oder Farben, erfassen, die dann für seine Bilder zu besseren Suchergebnissen und Empfehlungen führen.

Voicebox setzt auf natürliche Sprachverarbeitung, um den Kontext von Gesprächen zu identifizieren und auf diese Weise smarte KI-Anwendungen, wie sprachgesteuerte Geräte und persönliche Assistenten, zu verbessern.

Dank Databricks wurde Riot Games in die Lage versetzt, in seinen Spielen in Echtzeit Beleidigungen zwischen den Spielern aufzuspüren – und entsprechend dagegen vorzugehen. Kundenzufriedenheit, Kundenbindung und Lifetime-Value konnten so deutlich gesteigert werden. Video