Spark su Databricks
La piattaforma migliore per eseguire carichi di lavoro Spark, dai creatori originali di Apache Spark™
Semplicità, eccellenza operativa ai vertici del settore e benefici in termini di prezzo/prestazioni fanno della Databricks Lakehouse Platform l'ambiente migliore su cui eseguire i carichi di lavoro Apache Spark™
![Best-in-class operational excellence](/en-website-assets/static/a6f1afffe73365c064ba4a7c3a515b0c/best-in-class-1-image1681864377.png)
Eccellenza operativa ai vertici del settore
Aiutiamo migliaia di clienti a lanciare milioni di macchine virtuali (VM) ogni giorno per eseguire le loro applicazioni Spark. Inoltre, supportiamo gli strumenti e le guide per sviluppatori più avanzati, consentendo di sviluppare e implementare applicazioni Spark in modo semplice e affidabile.
- Le applicazioni Spark possono essere eseguite singolarmente o implementate facilmente su Databricks Workflows
- I notebook Spark possono essere eseguiti con altri tipi di compiti per pipeline di dati dichiarative su risorse di calcolo completamente gestite
- Il monitoraggio del flusso di lavoro consente di tracciare facilmente le prestazioni delle applicazioni Spark nel tempo e diagnosticare i problemi con pochi clic
![Best price/performance for Spark workloads](/en-website-assets/static/be9930441e3f695feda59f5a0f06923e/Best-price-performance-2-image1681864461.png)
Il miglior rapporto prezzo/prestazioni per carichi di lavoro Spark
Eseguire i carichi di lavoro Spark sulla Databricks Lakehouse Platform significa beneficiare di Photon , un veloce motore di esecuzione vettoriale C++ per carichi di lavoro Spark e SQL che gira dietro le interfacce di programmazione esistenti di Spark. Photon offre prestazioni di query da record a costi bassi, sfruttando al tempo stesso le architetture hardware più moderne come AWS Graviton.
Oltre alle prestazioni ad altissima velocità, Spark su Databricks assicura un TCO complessivo ridotto grazie a funzionalità come l'autodimensionamento dinamico, che consente di pagare "a consumo". Databricks offre inoltre istanze GPU e spot.
![Databricks Lakehouse Platform](/en-website-assets/static/c99e364cb6307a9233d77a4ac840dfec/databricks-lakehouse-platform-img1681864532.png)
Analisi a 360 gradi e governance unificata con la Databricks Lakehouse Platform
Mentre altre piattaforme richiedono di integrare più strumenti e gestire diversi modelli di governance, Databricks unifica data warehouse, data lake e dati in streaming in un'unica, semplice piattaforma lakehouse per gestire tutti i casi d'uso di data engineering, analisi e AI. La soluzione è costruita su una piattaforma aperta e affidabile che gestisce in maniera efficiente tutti i tipi di dati, unifica batch e streaming, e applica un unico modello comune di sicurezza e governance, per tutti i dati e le piattaforme cloud.
![Sigmod Awards](/en-website-assets/static/290e345276667ea2ea4abe066ccf127b/sigmod-systems-award-img1681864675.png)
Innovazione continua
The 2022 SIGMOD Systems Award ha riconosciuto Spark come sistema open-source per l'elaborazione unificata dei dati innovativo e ampiamente diffuso, che comprende carichi di lavoro relazionali, in streaming e machine learning.
E l'innovazione continua. Recentemente abbiamo introdotto Spark Connect e Project Lightspeed.
Spark Connect disaccoppia il client e il server per aumentare la stabilità e consente di realizzare applicazioni Spark ovunque.
Project Lightspeed, la nuova generazione di Spark Structured Streaming, porta miglioramenti in termini di bassa latenza prevedibile e funzionalità avanzate per l'elaborazione di eventi.