Direkt zum Hauptinhalt

Häufig gestellte Fragen über Databricks

Allgemeine Fragen

Werden sie richtig verarbeitet und analysiert, eröffnen Daten Unternehmen – unzählige Möglichkeiten, bestehende Geschäftsprozesse zu optimieren und neue Geschäftsmodelle zu erschließen. Es ist die Aufgabe von Data Science-Teams solche Möglichkeiten aufspüren und ihrem Unternehmen zunutze zu machen. Keine leichte Aufgabe. Denn bislang standen ihnen hierzu meist nur schwerfällige Tools und eine schwierig einzurichtende Infrastruktur zur Verfügung. Anstatt Ihrem Unternehmen neue Geschäftsmöglichkeiten zu erschließen, waren die Data Science-Teams genötigt, erhebliche Teile ihrer Arbeitszeit auf die Handhabung dieser Tools und Infrastrukturen zu verwenden. Dies gilt besonders, wenn große Datenmengen, Big Data, ins Spiel kommen.

Databricks wurde von uns entwickelt, um Ihren Data Science-Teams den Umgang mit Big Data zu vereinfachen. Einen ersten Schritt in diese Richtung hatte vor einiger Zeit bereits Apache Spark™ unternommen – mit der Bereitstellung eines einheitlichen Frameworks für die Entwicklung von Daten-Pipelines. Wir bei Databricks gehen noch einen Schritt weiter. Denn wir stellen eine Spark-basierende Cloud-Plattform bereit, für die keinerlei zusätzliches Management erforderlich ist. Die Plattform bietet: 1) vollständig verwaltete Spark-Cluster, 2) einen interaktiven Arbeitsbereich für Untersuchungen und Visualisierungen, 3) ein Planungstool für Produktions-Pipelines und 4) eine Plattform zur Unterstützung der von Ihnen favorisierten Spark-basierenden Anwendungen. Anstatt sich mit Datenproblemen herumzuschlagen, können sich Ihre Data Science-Teams so endlich wieder ganz darauf konzentrieren, was wirklich zählt: Ihrem Unternehmen neue Geschäftsmöglichkeiten zu erschließen.

Fragen zur Verfügbarkeit

Die Preisgestaltung bei Databricks wird ausführlich auf unserer Preisseite erklärt.

Technische Fragen

Derzeit unterstützt Databricks auf Browsern basierende Datei-Uploads. Daten können aus Azure Blob Storage, AWS S3, Azure SQL Data Warehouse, Azure Data Lake Store und NoSQL-Datenspeichern, wie Cosmos DB, Cassandra, Elasticsearch, JDBC-Datenquellen, HDFS, Sqoop und einer Vielzahl weiterer Datenquellen abgerufen werden. Der Vorgang wird von Apache Spark unterstützt.

Fragen zur Bereitstellung

Databricks ist derzeit in Microsoft Azure, Amazon AWS und Google Cloud verfügbar.

Sicherheitsfragen

Nutzer von Databricks verarbeiten und lagern ihre Daten in ihren eigenen Datenspeichern – abgesichert durch ihre eigenen Zugangsdaten.