Delta Lake
Demo-Typ
Produktanleitung
Laufzeit
Selbststudium
Ähnliche Inhalte
Was Sie lernen werden
Delta Lake ist eine formatunabhängige Speicherebene, die in Ihrem Delta Lage für Leistung, Sicherheit und Zuverlässigkeit sorgt – sei es im Streaming- oder im Batch-Betrieb. Dabei ersetzt Delta Lake vorhandene Datensilos durch ein zentrales Repository für strukturierte, teilstrukturierte und unstrukturierte Daten und bildet so die Grundlage für ein kostengünstiges und hochgradig skalierbares Lakehouse.
In dieser Demo zeigen wir Ihnen, wie Delta Lake funktioniert und seine Hauptfunktionen:
- ACID-Transaktionen
- Unterstützung für DELETE/UPDATE/MERGE
- Batch und Streaming zusammenführen
- Zeitreise
- Klonen Sie eine Nullkopie
- Erzeugte Partitionen
- CDF (Change Data Flow) (DBR-Laufzeit)
- Delta 3.0: Blitzschnelle Abfragen mit Liquid Clustering, automatische Erstellung Ihrer Partitionen ohne Verzerrung
- Delta 3.0: Universelles Format, das anderen Formaten erlaubt, Ihre Delta Lake Tabellen nativ zu lesen, ohne Einschränkungen (Uniform)
Um die Demo zu installieren, besorgen Sie sich eine kostenlose Databricks-Arbeitsumgebung und führen Sie die folgenden zwei Befehle in einem Python-Notizbuch aus
%pip installiere dbdemos
importiere dbdemos
dbdemos.installiere('delta-lake')
Dbdemos ist eine Python-Bibliothek, die vollständige Databricks-Demos in Ihren Arbeitsbereichen installiert. Dbdemos lädt und startet Notebooks, Delta Live Tables Pipelines, Cluster, Databricks SQL Dashboards, Warehouse-Modelle ... Sehen Sie wie man dbdemos verwendet
Dbdemos wird als ein GitHub-Projekt verteilt.
Für weitere Details, bitte das GitHub README.md Datei ansehen und die Dokumentation befolgen.
Dbdemos wird so wie es ist bereitgestellt. Siehe die Lizenz und Hinweis für weitere Informationen.
Databricks bietet keinen offiziellen Support für dbdemos und die zugehörigen Assets.
Bei Problemen, bitte ein Ticket öffnen und das Demo-Team wird sich nach bestem Bemühen darum kümmern.