Databricks für Data Engineering

Erstellen Sie schnelle und zuverlässige Daten-Pipelines

Eine Cloud-optimierte Plattform, ausgerüstet mit Apache Spark™

Databricks Runtime bildet das Herzstück der Databricks Unified Analytics-Plattform.
Es basiert auf einem hochoptimierten Spark-Cluster und kann Daten bis zu fünfmal schneller als andere Lösungen verarbeiten.

Databricks I/O

Ein vertikal integrierter Stack wird genutzt, um die I/O-Ebene und die Verarbeitungsebene zu optimieren – wodurch die Spark-Performance in der Cloud merklich angehoben wird.

Databricks ohne Server

Die serverlose Architektur demokratisiert die Infrastruktur durch die automatische Konfiguration und Skalierung von Computing-Ressourcen. Dies ermöglicht eine erstklassige Leistung, bei gleichzeitig spürbar niedrigeren Kosten.

Vollständige Verwaltung in der Cloud

Eine Cloud-native Plattform, welche die Komplexität einer Big Data-Infrastruktur reduziert. Die Folge: eine hochflexible, zuverlässige und leistungsfähige Plattform für die Entwicklung innovativer Produkte.


Databricks Runtime übertrifft die Performance anderer Computing-Engines:

5x schneller
Als die einfache Version von Apache Spark auf AWS
Gesamtlaufzeit bei 104 Abfragen
(in Sek. – je weniger, desto besser)

8x schneller
Als Apache Presto auf AWS
Mittlere Laufzeit für 62 Abfragen
(in Sek. – je weniger, desto besser)

3x schneller
Als die lokale Lösung von Impala über Cloudera
Gesamtlaufzeit für 77 Impala-Abfragen, standardisiert nach CPU-Recheneinheiten
(in Sek. – je weniger, desto besser)


Databricks half uns dabei, eine neue Funktion auf den Markt zu bringen und gleichzeitig die Leistung unserer Daten-Pipeline um das Zehnfache zu verbessern. Heute unterstützt die Databricks-Lösung unsere gesamte Produktions-Pipeline mit mehreren Terabyte an Spark-Clustern.

Logo von MyFitnessPal

Chul Lee, Director of Data Engineering & Science bei MyFitnessPal

So kann Databricks die Performance Ihrer Daten-Pipeline optimieren:

Optimierte Prozesse von ETL bis zur Produktion

Teamübergreifende Zusammenarbeit

Fördern Sie die Zusammenarbeit und den Austausch von Erkenntnissen in Echtzeit, innerhalb und zwischen Ihren Data Engineering-, Data Science- und Business-Teams – mit einem interaktiven Arbeitsbereich.

Produktions-Workflows

Nutzen Sie eine einheitlichte Plattform, die Workflows Ende-zu-Ende optimiert – von der Datenaufnahme und ETL, über die Datenuntersuchung und Modellerstellung, bis hin zur Bereitstellung der Modelle für die Produktion und zu Datenprodukten.

Vereinheitlichung aller Analysen

Bewegen Sie sich nahtlos durch verschiedene Analysearten, wie Batch-Verarbeitung, Ad-hoc-Verarbeitung, Machine Learning, Deep Learning, Stream-Verarbeitung und Graph-Verarbeitung.

Stabile Integrationen

Nutzen Sie das breite Angebot einer Vielzahl von AWS-Tools und Datenspeichern mit integrierten Konnektoren und integrieren Sie diese mit anderen Data Engineering-Diensten, um CI/CD-Prozesse mit umfassenden APIs zu vereinfachen.


Einen agilen Innovations-Workflow zu besitzen, ist für McGraw-Hill Education von entscheidender Bedeutung. Die Databricks Unified Analytics-Plattform ist der Mittelpunkt unseres technologischen Ökosystems. Sie ist die Grundlage unserer Innovations-Pipelines und -Workflows.

Logo von McGraw-Hill Education

Alfred Essa, VP of Research and Data Science, McGraw-Hill Education

So optimiert Databricks Entwicklungs-Workflows, um die Effizienz von Prozessen zu verbessern:

Schutz von Unternehmensdaten auf Spark

Starke Datenverschlüsselung

Profitieren Sie von einem erstklassigem Schutz – während der Speicherung und der Übertragung Ihrer Daten.

Überwachung und Auditing

Greifen Sie auf umfassende Überwachungsprotokolle zu, um ihre Datensicherheit im Blick zu behalten und Probleme rasch zu beheben.

Vereinheitlichung aller Analysen

Detaillierter Verwaltungszugriff auf jede Komponente der Dateninfrastruktur des Unternehmens, wie Dateien, Cluster, Code, implementierte Anwendungen und Dashboards.

Integriertes Identitätsmanagement

Nahtlose Integration mit Anbietern von Identitätsmanagementlösungen für Unternehmen über SAML 2.0 und Active Directory.


Erfahren Sie, wie es Databricks gelingt, die höchsten Sicherheitsstandards einzuhalten:

Der große Databricks-Vorteil: Spark-Expertise

Experten-Support

Databricks bietet einen Kundensupport von einzigartiger Qualität. Denn dasselbe Team, welches heute Databricks-Kunden unterstützt, rief vor vielen Jahren das Spark-Forschungsprojekt an der UC Berkeley ins Leben, aus dem dann Apache Spark hervorgegangen ist.

Professionelle Services

Innovieren Sie schneller mit den Services von Databricks und Spark, wie Solution-Architecting und Workload-Optimierung.

Immer verfügbar

Profitieren Sie von einem Rund-um-die-Uhr-Support, um sicherzugehen, dass Ihre Probleme schnell gelöst werden. Bei Databricks liegt die Reaktionszeit für den Support auf Produktionsebene bei einer Stunde.

Technische Ressourcen

Nutzen Sie eine Online-Bibliothek, die mit Dokumentationen, Best Practices, Benutzerhandbüchern und anderen technischen Ressourcen ausgestattet ist.


Die Qualität von Databricks Support und die Art, wie seine Experten unserem Team dabei halfen, seine Aufgaben erfolgreich umzusetzen, waren für unser Unternehmen von entscheidender Bedeutung.

Logo von Hotels.com

Matt Fryer, VP, Chief Data Science Officer, Hotels.com

Support durch qualifizierte Spark-Experten:

 Mehr Infos über den Support

Niedrigere Gesamtbetriebskosten mit einer intelligenteren Infrastrukturverwaltung

Bessere Performance

Mit Cloud-optimierten Clustern lassen sich Jobs schneller abschließen, wodurch sich die Kosten für Cloud-Computing reduzieren.

Vollständig verwaltete Cluster

Die vollständige Verwaltung der Cluster erlaubt weitere Kostenreduzierungen, da zeitaufwändige Aufgaben zum Erstellen, Konfigurieren und Verwalten der komplexen Spark-Infrastruktur wegfallen.

Sie zahlen nur, was Sie auch tatsächlich nutzen

Durch sekundengenaue Abrechnung senken Sie Ihre Kosten.

Eingepreist für Data Engineering

Geringere Kosten für Data Engineering-Produktions-Workloads.
Zu den Preisen >


Databricks ist das System unserer Wahl, wenn Deep Data verarbeitet und analysiert werden soll. In kurzer Zeit konnten wir die Geschwindigkeit unserer Datenverarbeitung um das Vierfache steigern – ohne die Betriebskosten erhöhen zu müssen.

Logo von Eyeview

Gal Barnea, CTA, Eyeview

Erfahren Sie, wie Databricks zur Senkung der Gesambetriebskosten beitragen kann: