Lakehouse Monitoring으로 데이터 품질을 모니터링하세요

학습할 내용

Lakehouse Monitoring을 사용하면 Databricks 데이터 인텔리전스 플랫폼에서 직접 프로파일링, 진단, 품질을 강제할 수 있습니다. 추가 도구나 복잡성 없이 Lakehouse Monitoring은 팀이 하류 프로세스에 영향을 미치기 전에 품질 문제를 미리 발견하는 데 도움이 됩니다.

이 튜토리얼을 통해 Unity 카탈로그의 어떤 테이블에서든 모니터를 생성하고 데이터 트렌드와 이상치에 대한 인사이트를 얻는 것이 얼마나 쉬운지 확인할 수 있습니다. 이 튜토리얼은 소매 업체의 사용 사례를 모니터링하고 모니터를 구성할 때의 모범 사례를 설명합니다. 데모가 끝나면 품질 문제/이상을 발견하는 자동 생성 대시보드를 얻게 됩니다:

  • 데이터 볼륨
  • 데이터 무결성
  • 숫자 분포 변화
  • 범주형 분포 변경

Unity Catalog에 내장된 Lakehouse Monitoring을 사용하면, 이 데모는 메타데이터와 통합된 품질이 어떻게 원인 분석과 영향 분석을 수행하는 데 도움이 되는지 보여줍니다.

Lakehouse Monitoring에 대한 자세한 정보는 제품 문서(AWS | Azure)를 참조하여 오늘 시작해 보세요.

 

데모를 설치하려면 무료 Databricks 워크스페이스 를 받아 Python 노트북에서 다음 두 명령을 실행하세요

%pip dbdemos 설치
import dbdemos
dbdemos.install('lakehouse-monitoring', catalog='main', schema='dbdemos_lhm')

Dbdemos는 Python 라이브러리로, 여러분의 워크스페이스에 완전한 Databricks 데모를 설치합니다. Dbdemos는 노트북, 델타 라이브 테이블 파이프라인, 클러스터, 데이터브릭스 SQL 대시보드, 그리고 웨어하우스 모델을 로드하고 시작합니다... dbdemos 사용 방법을 참조하세요.

 

Dbdemos는 GitHub 프로젝트로 배포됩니다.

자세한 내용은 GitHub의 README.md 파일 을 참조하고 문서를 따라주세요.
Dbdemos는 그대로 제공됩니다.
라이선스 와 공지 를 참조하여 자세한 정보를 확인하세요.
Databricks는 dbdemos 및 관련 자산에 대한 공식 지원을 제공하지 않습니다.
문제가 발생한 경우 티켓을 열어주시면 데모 팀이 최선을 다해 살펴보겠습니다.