Spark Streaming - Fortgeschritten
Demotyp
Produktanleitung
Laufzeit
Selbststudium
Ähnliche Inhalte
Was Sie lernen werden
Die Databricks Lakehouse Plattform vereinfacht das Datenstreaming erheblich, um Echtzeitanalysen, maschinelles Lernen und Anwendungen auf einer Plattform zu liefern. In dieser Demo zeigen wir, wie das Databricks Lakehouse Streaming-Funktionen bietet, um Clickstream-Daten zu erfassen und zu analysieren (typischerweise aus Nachrichtenwarteschlangen wie Kafka).
Sessionisierung ist der Prozess, zeitlich begrenzte Benutzersitzungen aus einem Fluss von Ereignissen zu finden und alle Ereignisse zu gruppieren, die etwa zur gleichen Zeit stattfinden (z.B. Anzahl der Klicks, am häufigsten angesehene Seiten usw.)
Das Verständnis von Sitzungen ist für viele Anwendungsfälle von entscheidender Bedeutung:
- Erkennen Sie Warenkorb-Abbrüche in Ihrem Online-Shop und lösen Sie automatisch Marketingaktionen als Nachfolge aus, um Ihren Umsatz zu steigern
- Erstellen Sie bessere Attribution-Modelle für Ihre Affiliation, basierend auf den Benutzeraktionen während jeder Sitzung
- Verstehen Sie die Benutzerreise auf Ihrer Website und bieten Sie ein besseres Erlebnis, um Ihre Benutzerbindung zu erhöhen
In dieser Demo werden wir:
- Daten von Kafka einlesen
- Speichern Sie die Daten als Delta-Tabellen, um Qualität und Leistung im großen Maßstab zu gewährleisten
- Berechnen Sie Benutzersitzungen basierend auf Aktivitäten
Um die Demo zu installieren, besorgen Sie sich eine kostenlose Databricks-Arbeitsumgebung und führen Sie die folgenden zwei Befehle in einem Python-Notebook aus.
%pip installieren Sie dbdemos
importiere dbdemos
dbdemos.installiere('streaming-sessionization')
Dbdemos ist eine Python-Bibliothek, die vollständige Databricks-Demos in Ihren Arbeitsbereichen installiert. Dbemos lädt und startet Notebooks, Delta Live Tables Pipelines, Cluster, Databricks SQL Dashboards, Warehouse-Modelle ... Siehe wie man dbdemos verwendet
Dbdemos wird als GitHub-Projekt bereitgestellt.
Für weitere Details, sehen Sie bitte die GitHub README.md Datei an und folgen Sie der Dokumentation.
Dbdemos wird so wie es ist bereitgestellt. Sehen Sie die Lizenz und Hinweis für weitere Informationen.
Databricks bietet keinen offiziellen Support für dbdemos und die zugehörigen Assets.
Bei Problemen öffnen Sie bitte ein Ticket und das Demo-Team wird sich nach bestem Bemühen darum kümmern.