Delta Lake

데모 유형

제품 튜토리얼

기간

자기 주도적 학습

소셜

학습할 내용

Delta Lake는 데이터 레이크에서 안정성, 보안과 성능을 제공하는 오픈 형식 스토리지 계층입니다. 스트리밍 작업과 배치 작업 둘 다에 적합합니다. Delta Lake는 데이터 사일로를 구조적, 반구조적, 비구조적 데이터를 모두 담은 단 하나의 홈으로 대체하므로 비용 효율적이고 고도로 확장 가능한 레이크하우스의 기본 토대가 되어줍니다.

이 데모에서는 Delta Lake의 작동 방식과 주요 기능을 보여드리겠습니다:

  • ACID 트랜잭션
  • DELETE/UPDATE/MERGE 지원
  • 배치와 스트리밍 통합
  • 시간 이동
  • 클론 제로 복사
  • 생성된 파티션
  • CDF (변경 데이터 흐름) (DBR 런타임)
  • Delta 3.0: Liquid Clustering을 사용하여 빠른 쿼리를 실행하고, 왜곡 없이 파티션을 자동으로 생성합니다
  • Delta 3.0: 다른 형식이 락인 없이 원래의 Delta Lake 테이블을 읽을 수 있게 해주는 Universal Format (Uniform)

 

데모를 설치하려면 무료 Databricks 워크스페이스 를 받아 Python 노트북에서 다음 두 명령을 실행하세요

%pip dbdemos 설치
import dbdemos
dbdemos.install('delta-lake')

Dbdemos는 여러분의 작업 공간에 완전한 Databricks 데모를 설치하는 Python 라이브러리입니다. Dbdemos는 노트북, Delta Live Tables 파이프라인, 클러스터, Databricks SQL 대시보드, 웨어하우스 모델 등을 로드하고 시작합니다... dbdemos 사용 방법을 확인해 보세요

 

Dbdemos는 GitHub 프로젝트로 배포됩니다.

자세한 내용은 GitHub의 README.md 파일 을 참조하고 문서를 따르십시오.
Dbdemos는 그대로 제공됩니다. 자세한 내용은
라이센스공지 를 참조하십시오.
Databricks는 dbdemos 및 관련 자산에 대한 공식 지원을 제공하지 않습니다.
문제가 발생한 경우 티켓을 열어주시면 데모 팀이 최선을 다해 살펴보겠습니다.

권장

<p><span><span><span><span><span><span>식별자, 기본 키 및 외래 키를 사용한 데이터 웨어하우징</span></span></span></span></span></span></p>

튜토리얼

식별자, 기본 키 및 외래 키를 사용한 데이터 웨어하우징

<p>Full Delta Live Tables Pipeline — Loan</p>

튜토리얼

Full Delta Live Tables Pipeline — Loan

<p>CDC Pipeline With Delta Live Tables</p>

튜토리얼

CDC Pipeline With Delta Live Tables