Open source

Gli ingegneri di Databricks sono i creatori di alcune delle tecnologie open-source per la gestione dei dati più utilizzate al mondo

Unisciti a un meetup
immagine sfondo

I nostri progetti open-source più noti

icon-title
Apache SparkTM
Apache Spark è un motore unico per eseguire carichi di lavoro per ingegneria dei dati, data science e ML.

Che cos'è Apache Spark? →

Spark e Databricks a confronto →

Visita spark.apache.org →

icon-title
Delta Lake
Delta Lake consente di costruire un'architettura lakehouse su sistemi di storage come AWS S3, ADLS, GCS e HDFS.

Maggiori informazioni su Delta Lake →

Visita delta.io →

Dibattiti tecnici: Primi passi con Delta Lake →

icon-title
MLflow
MLflow gestisce il ciclo di vita ML, con sperimentazione, riproducibilità, implementazione e un registro centralizzato dei modelli.

Managed MLflow su Databricks →

Visita mlflow.org →

Dibattiti tecnici: Gestire il ciclo di vita ML →

icon-title
Redash
Redash consente a tutti di utilizzare SQL per esplorare, interrogare, visualizzare e condividere dati da sorgenti di piccola e grande entità.

Visita Redash su GitHub →

icon-title
Delta Sharing
Delta Sharing è il primo protocollo aperto per la condivisione sicura dei dati, che semplifica la condivisione con altre organizzazioni.

Visita Delta Sharing →

Databricks supporta altre tecnologie open-source molto diffuse

icon-title
TensorFlow
Databricks supporta TensorFlow, una libreria per deep learning e calcolo generico su cluster

TensorFlow su Databricks →

icon-title
PyTorchTM
Facebook, creatore di PyTorch, e Databricks hanno collaborato alle integrazioni

PyTorch su Databricks →

icon-title
KerasTM
API di Deep Learning scritte in Python che girano su TensorFlow. Disponibili in Databricks Runtime per ML.

Keras su Databricks →

icon-title
RStudio
Una suite open-source di strumenti per data science collaborativa che utilizza R ​

Programmazione R su Big Data →

icon-title
scikit-learn
Pacchetto Python molto utilizzato per machine learning basato su NumPy, SciPy e Matplotlib​​

Scikit-learn su Databricks →

icon-title
XGBoost
Libreria software di regolarizzazione del gradiente per linguaggi come Python, R e C++

XGBoost su Databricks →

icon-title
Terraform
HashiCorp Terraform is a popular open source tool for creating safe and predictable cloud infrastructure across several cloud providers. Databricks Terraform provider allows customers to manage their entire Databricks workspaces along with the rest of their infrastructure using a flexible, powerful tool. Using Terraform also encourages customers to adopt best practices with infrastructure as code (IaC).

Terraform on Databricks →

Pronti per cominciare?