Open-Source

Einige der weltweit beliebtesten Open-Source-Datentechnologien wurden ursprünglich von Databricks-Ingenieuren erfunden

An einem Treffen teilnehmen
Hintergrundbild

Unsere beliebtesten Open-Source-Projekte

Symboltitel
Apache Spark™
Apache Spark ist eine vereinheitlichte Engine zum Ausführen von Data-Engineering-, Data-Science- und ML-Workloads.

Was ist Apache Spark? →

Spark und Databricks im Vergleich →

spark.apache.org besuchen →

Symboltitel
Delta Lake
Mit Delta Lake können Sie eine Lakehouse-Architektur auf Speichersysteme wie AWS S3, ADLS, GCS und HDFS aufsetzen.

Weitere Informationen zu Delta Lake →

delta.io besuchen →

Tech Talks: Erste Schritte mit Delta Lake →

Symboltitel
MLflow
MLflow verwaltet den ML-Lebenszyklus, einschließlich Experimente, Reproduzierbarkeit, Implementierung und einer zentralen Modellregistrierung.

Managed MLflow auf Databricks →

mlflow.org besuchen →

Tech Talks: Den ML-Lifecycle verwalten →

Symboltitel
Redash
Mit Redash kann wirklich jeder Anwender SQL nutzen, um Daten aus großen und kleinen Datenquellen zu untersuchen, abzufragen, zu visualisieren und zu teilen.

Redash auf GitHub besuchen →

Symboltitel
Delta-Freigabe
Delta Sharing ist das branchenweit erste offene Protokoll für die sichere Datenfreigabe. Mit Delta Sharing wird der Datenaustausch mit anderen Organisationen zum Kinderspiel.

Delta-Freigabe besuchen →

Databricks unterstützt außerdem die folgenden beliebten Open-Source-Technologien

Symboltitel
TensorFlow
Databricks unterstützt TensorFlow, eine Bibliothek für Deep Learning und allgemeine Berechnungen auf Clustern

TensorFlow auf Databricks →

Symboltitel
PyTorch™
PyTorch-Schöpfer Facebook und Databricks entwickeln gemeinsam Integrationen

PyTorch auf Databricks →

Symboltitel
Keras™
In Python geschriebene Deep-Learning-API, die auf TensorFlow aufbaut. Verfügbar in Databricks Runtime für Machine Learning.

Keras auf Databricks →

Symboltitel
RStudio
Eine Sammlung von Open-Source-Tools für kollaborative Data Science mit R

R-Programmierung für Big Data →

Symboltitel
Scikit-learn
Weit verbreitetes Python-Paket für maschinelles Lernen, das auf NumPy, SciPy und Matplotlib aufbaut

Scikit-learn auf Databricks →

Symboltitel
XGBoost
Eine verteilte Gradient-Boosting-Bibliothek mit Bindungen in Sprachen wie Python, R und C++

XGBoost auf Databricks →

Möchten Sie loslegen?