Überwachen Sie Ihre Datenqualität mit Lakehouse Monitoring

Was Sie lernen werden

Lakehouse Monitoring ermöglicht es Ihnen, Qualität direkt in der Databricks Data Intelligence Plattform einfach zu profilieren, zu diagnostizieren und durchzusetzen. Ohne zusätzliche Werkzeuge oder Komplexität hilft Lakehouse Monitoring Teams, Qualitätsprobleme proaktiv zu entdecken, bevor nachgelagerte Prozesse beeinträchtigt werden.

Durch dieses Tutorial können Sie sehen, wie einfach es ist, einen Monitor für jede Tabelle im Unity-Katalog zu erstellen und Einblicke in Datentrends und Anomalien zu erhalten. Dieses Tutorial wird ein Einzelhandelsanwendungsfall zur Überwachung von Transaktionsdaten veranschaulichen und die besten Praktiken bei der Konfiguration eines Monitors durchgehen. Am Ende der Demo erhalten Sie ein automatisch generiertes Dashboard, um Qualitätsprobleme/Anomalien in: zu entdecken.

  • Datenvolumen
  • Datenintegrität
  • Änderung der numerischen Verteilung
  • Kategoriale Verteilungsänderung

Mit dem in Unity Catalog integrierten Lakehouse Monitoring zeigt Ihnen diese Demo auch, wie Qualität in Verbindung mit Metadaten es Ihnen ermöglicht, Ursachenanalyse und Auswirkungsanalyse mit Abstammung durchzuführen.

Für weitere Informationen zur Überwachung von Lakehouse, sehen Sie bitte unsere Produktdokumentation (AWS | Azure) um heute noch zu beginnen.

 

Um die Demo zu installieren, besorgen Sie sich eine kostenlose Databricks-Arbeitsumgebung und führen Sie die folgenden zwei Befehle in einem Python-Notebook aus.

%pip installieren Sie dbdemos
importiere dbdemos
dbdemos.installiere('lakehouse-monitoring', Katalog='main', Schema='dbdemos_lhm'

Dbdemos ist eine Python-Bibliothek, die vollständige Databricks-Demos in Ihren Arbeitsbereichen installiert. Dbdemos lädt und startet Notebooks, Delta Live Tables Pipelines, Cluster, Databricks SQL Dashboards und Warehouse-Modelle... Siehe wie man dbdemos verwendet

 

Dbdemos wird als GitHub-Projekt bereitgestellt.

Für weitere Details, bitte sehen Sie sich die GitHub README.md Datei an und folgen Sie der Dokumentation.
Dbdemos wird so bereitgestellt, wie es ist. Siehe die 
Lizenz und Hinweis für weitere Informationen.
Databricks bietet keinen offiziellen Support für dbdemos und die zugehörigen Assets.
Bei Problemen, bitte ein Ticket öffnen und das Demo-Team wird sich nach bestem Bemühen darum kümmern.