Spark Streaming - Fortgeschritten

Demotyp

Produktanleitung

Laufzeit

Selbststudium

Social Media

Was Sie lernen werden

Die Databricks Lakehouse Plattform vereinfacht das Datenstreaming erheblich, um Echtzeitanalysen, maschinelles Lernen und Anwendungen auf einer Plattform zu liefern. In dieser Demo zeigen wir, wie das Databricks Lakehouse Streaming-Funktionen bietet, um Clickstream-Daten zu erfassen und zu analysieren (typischerweise aus Nachrichtenwarteschlangen wie Kafka).

Sessionisierung ist der Prozess, zeitlich begrenzte Benutzersitzungen aus einem Fluss von Ereignissen zu finden und alle Ereignisse zu gruppieren, die etwa zur gleichen Zeit stattfinden (z.B. Anzahl der Klicks, am häufigsten angesehene Seiten usw.)

Das Verständnis von Sitzungen ist für viele Anwendungsfälle von entscheidender Bedeutung:

  • Erkennen Sie Warenkorb-Abbrüche in Ihrem Online-Shop und lösen Sie automatisch Marketingaktionen als Nachfolge aus, um Ihren Umsatz zu steigern
  • Erstellen Sie bessere Attribution-Modelle für Ihre Affiliation, basierend auf den Benutzeraktionen während jeder Sitzung
  • Verstehen Sie die Benutzerreise auf Ihrer Website und bieten Sie ein besseres Erlebnis, um Ihre Benutzerbindung zu erhöhen

In dieser Demo werden wir:

  • Daten von Kafka einlesen
  • Speichern Sie die Daten als Delta-Tabellen, um Qualität und Leistung im großen Maßstab zu gewährleisten
  • Berechnen Sie Benutzersitzungen basierend auf Aktivitäten

 

Um die Demo zu installieren, besorgen Sie sich eine kostenlose Databricks-Arbeitsumgebung und führen Sie die folgenden zwei Befehle in einem Python-Notebook aus.

%pip installieren Sie dbdemos
importiere dbdemos
dbdemos.installiere('streaming-sessionization')

Dbdemos ist eine Python-Bibliothek, die vollständige Databricks-Demos in Ihren Arbeitsbereichen installiert. Dbemos lädt und startet Notebooks, Delta Live Tables Pipelines, Cluster, Databricks SQL Dashboards, Warehouse-Modelle ... Siehe wie man dbdemos verwendet

 

Dbdemos wird als GitHub-Projekt bereitgestellt.

Für weitere Details, sehen Sie bitte die GitHub README.md Datei an und folgen Sie der Dokumentation.
Dbdemos wird so wie es ist bereitgestellt. Sehen Sie die 
Lizenz und Hinweis für weitere Informationen.
Databricks bietet keinen offiziellen Support für dbdemos und die zugehörigen Assets.
Bei Problemen öffnen Sie bitte ein Ticket und das Demo-Team wird sich nach bestem Bemühen darum kümmern. 

Empfohlen

<p>Full Delta Live Tables Pipeline — Loan</p>

Tutorial

Full Delta Live Tables Pipeline — Loan

<p>CDC Pipeline With Delta Live Tables</p>

Tutorial

CDC Pipeline With Delta Live Tables

<p><span><span><span><span><span><span>Delta Lake</span></span></span></span></span></span></p>

Tutorial

Delta Lake