Spark Streaming — Avanzato
Tipo di Demo
Tutorial sul Prodotto
Durata
Autogestita
Contenuti associati
Che cosa imparerai
La piattaforma Lakehouse di Databricks semplifica notevolmente lo streaming dei dati per fornire analisi in tempo reale, apprendimento automatico e applicazioni su una sola piattaforma. In questa demo, presenteremo come il Lakehouse di Databricks fornisce capacità di streaming per ingerire e analizzare i dati del clickstream (tipicamente da code di messaggi come Kafka).
La sessionizzazione è il processo di ricerca di sessioni utente limitate nel tempo da un flusso di eventi, raggruppando tutti gli eventi che si verificano nello stesso periodo (ad esempio, numero di clic, pagine più visualizzate, ecc.)
Comprendere le sessioni è fondamentale per molti casi d'uso:
- Rileva l'abbandono del carrello nel tuo negozio online e attiva automaticamente azioni di marketing come follow-up per aumentare le tue vendite
- Costruisci modelli di attribuzione migliori per la tua affiliazione, basati sulle azioni degli utenti durante ogni sessione
- Comprendi il percorso dell'utente sul tuo sito web e fornisci un'esperienza migliore per aumentare la tua ritenzione degli utenti
In questa demo, faremo:
- Ingestire dati da Kafka
- Salva i dati come tabelle Delta, garantendo qualità e prestazioni su larga scala
- Calcolare le sessioni utente in base all'attività
Per installare la demo, ottieni un workspace Databricks gratuito ed esegui i seguenti due comandi in un notebook Python.
%pip installa dbdemos
importa dbdemos
dbdemos.install('streaming-sessionization')
Dbdemos è una libreria Python che installa demo complete di Databricks nei tuoi spazi di lavoro. Dbemos caricherà e avvierà quaderni, pipeline di Delta Live Tables, cluster, cruscotti Databricks SQL, modelli di magazzino... Vedi come usare dbdemos
Dbdemos è distribuito come un progetto GitHub.
Per ulteriori dettagli, si prega di consultare il file README.md su GitHub e seguire la documentazione.
Dbdemos è fornito così com'è. Consulta la Licenza e il Avviso per ulteriori informazioni.
Databricks non offre supporto ufficiale per dbdemos e gli asset associati.
Per qualsiasi problema, si prega di aprire un ticket e il team di demo esaminerà la questione nel miglior modo possibile.