DLT

Pipeline di dati affidabili semplificate

Semplifica i processi ETL in batch e streaming con affidabilità automatizzata e qualità dei dati

IL SUCCESSO DEI MIGLIORI TEAM POGGIA SU PIPELINE DI DATI INTELLIGENTI

VANTAGGI

Le best practice per le pipeline di dati, codificate

Dichiara le trasformazioni dei dati di cui hai bisogno e lascia che le pipeline di DLT si occupino del resto.

Acquisizione efficiente

La costruzione di pipeline ETL pronte per la produzione comincia con l'acquisizione dei dati. DLT consente un'acquisizione efficiente a data engineer, sviluppatori in Python, data scientist e analisti SQL. Carica dati da qualsiasi sorgente supportata da Apache Spark™ su Databricks, in batch, streaming o CDC.

Trasformazione intelligente

Con poche righe di codice, DLT riesce a determinare il modo più efficiente per costruire ed eseguire pipeline di dati in batch o in streaming, ottimizzando automaticamente in base al costo o alle prestazioni e riducendo al minimo la complessità.

Operazioni automatizzate

Le pipeline DLT semplificano lo sviluppo di processi ETL codificando le best practice fin dall'inizio e automatizzando le complessità operative. Grazie alle pipeline DLT, i tecnici possono concentrarsi sull'obiettivo di fornire dati di alta qualità invece di doversi preoccupare di gestire e manutenere l'infrastruttura delle pipeline.

Funzioni

Costruito per semplificare il pipelining dei dati

Costruire e gestire pipeline di dati non deve necessariamente essere difficile. DLT è stato progettato per combinare potenza e semplicità, così da consentirti di eseguire robusti processi ETL con appena qualche riga di codice.

Sfruttando l'API unificata di Spark per l'elaborazione sia in batch che in streaming, le pipeline DLT permettono di passare facilmente da una modalità di elaborazione all'altra.

Maggiori informazioni

Con DLT, è semplice ottimizzare le prestazioni delle pipeline dichiarando un'intera pipeline incrementale con tabelle in streaming e viste materializzate.

Maggiori informazioni

Le pipeline DLT supportano un ampio ecosistema di sorgenti e sink. Carica dati da qualsiasi fonte supportata da Apache Spark™ su Databricks, inclusi archivi cloud, bus di messaggi, feed di dati di modifica e sistemi esterni.

Maggiori informazioni

Le aspettative ti permettono di garantire che i dati che arrivano nelle tabelle soddisfino i requisiti di qualità dei dati e forniscono informazioni sulla qualità dei dati a ogni aggiornamento della pipeline.

Maggiori informazioni

Sviluppa pipeline nei notebook senza dover cambiare il contesto. Visualizza DAG, log degli eventi e codice in un'unica interfaccia e facilita lo sviluppo grazie a funzionalità di completamento automatico del codice, rilevamento degli errori in linea e diagnostica.

Maggiori informazioni

Altre funzioni

Governance e storage unificati

Basato sugli standard fondamentali del lakehouse, come Unity Catalog e formati di tabella aperti.

Maggiori informazioni

Compute serverless

Acquisizione dei dati con un rapporto prezzo/prestazioni fino a 5 volte migliore e risparmio del 98% sui costi per trasformazioni complesse.

Maggiori informazioni

Orchestrazione delle attività

Invece di definire manualmente una serie di attività Spark separate, ti basterà definire le trasformazioni, e DLT si assicurerà che vengano eseguite nell'ordine corretto.

Maggiori informazioni

Gestione degli errori e ripristino da guasti

Recupero senza interruzioni dagli errori che si verificano durante l'esecuzione delle pipeline di dati.

Maggiori informazioni

CI/CD e controllo delle versioni

Specifica facilmente configurazioni per isolare le pipeline negli ambienti di sviluppo, test e produzione.

Maggiori informazioni

Monitoraggio e osservabilità delle pipeline

Funzionalità integrate di monitoraggio e osservabilità, incluse provenienza dei dati, cronologia degli aggiornamenti e report sulla qualità dei dati.

Maggiori informazioni

Programmazione flessibile degli aggiornamenti

Ottimizza facilmente per latenza o costo a seconda delle esigenze della tua pipeline.

Maggiori informazioni

Casi d'uso

Semplifica le tue pipeline di dati

Esplora le demo di DLT

Vedi tutte le demo

getting started with dlt pipelines tile 1

Guida tecnica

Introduzione alle pipeline DLT

Tour di prodotto

Tour di prodotto delle pipeline DLT

video

Data engineering intelligente nell'era dell'AI

The Serverless Real Time Lakehouse in Action

video

Il lakehouse serverless in tempo reale in azione

Prezzi

I prezzi basati sull'utilizzo tengono sotto controllo la spesa

Si pagano solo i prodotti utilizzati e conteggiati al secondo.

Scopri i prezzi

Prodotti correlati

Scopri di più

Esplora altre offerte integrate e intelligenti sulla Data Intelligence Platform.

LakeFlow Connect

Connettori efficienti per l'acquisizione di dati da qualsiasi fonte e integrazione nativa con la Data Intelligence Platform facilitano l'accesso all'analisi e all'AI, con una governance unificata.

Flussi di lavoro

Definisci, gestisci e monitora facilmente flussi di lavoro multitasking per pipeline di ETL, analisi e machine learning. Grazie a un'ampia gamma di tipologie di task supportati, funzioni di osservabilità approfondita e alta affidabilità, i team di gestione dei dati saranno in grado di automatizzare e orchestrare meglio qualsiasi pipeline e diventare più produttivi.

Archiviazione nel lakehouse

Unifica i dati nel tuo lakehouse, di qualunque formato e tipo, per tutti i tuoi carichi di lavoro di analisi e AI.

Unity Catalog

Gestisci tutti i tuoi asset di dati con l'unica soluzione di governance unificata e aperta del settore per dati e AI, integrata nella Databricks Data Intelligence Platform.