Spark Streaming — 고급

데모 유형

제품 튜토리얼

기간

자기 주도적 학습

소셜

학습할 내용

Databricks Lakehouse 플랫폼은 데이터 스트리밍을 대폭 단순화하여 실시간 분석, 머신 러닝 및 한 플랫폼에서의 애플리케이션 제공을 가능하게 합니다. 이 데모에서는 Databricks Lakehouse가 클릭스트림 데이터(일반적으로 Kafka와 같은 메시지 큐에서)를 수집하고 분석하는 스트리밍 기능을 제공하는 방법을 보여드리겠습니다.

세션화는 이벤트 흐름에서 시간 제한 사용자 세션을 찾는 과정으로, 동일한 시간 주변에서 발생하는 모든 이벤트(예: 클릭 수, 가장 많이 본 페이지 등)를 그룹화합니다.

세션을 이해하는 것은 많은 사용 사례에서 중요합니다:

  • 온라인 샵에서 장바구니 포기를 감지하고, 판매를 증가시키기 위해 후속 마케팅 활동을 자동으로 트리거합니다.
  • 사용자의 각 세션 동안의 행동에 기반하여 귀속 모델을 더 잘 구축하세요
  • 당신의 웹사이트에서 사용자 경험을 이해하고, 사용자 유지율을 높이기 위해 더 나은 경험을 제공하세요

이 데모에서는 다음을 수행합니다:

  • Kafka에서 데이터 수집
  • 데이터를 델타 테이블로 저장하여 규모에 따른 품질과 성능을 보장합니다
  • 활동을 기반으로 사용자 세션을 계산합니다

 

데모를 설치하려면 무료 Databricks 워크스페이스 를 받아 Python 노트북에서 다음 두 명령을 실행하세요

%pip dbdemos 설치
import dbdemos
dbdemos.install('스트리밍-세션화')

Dbdemos는 Python 라이브러리로, 여러분의 워크스페이스에 완전한 Databricks 데모를 설치합니다. Dbemos는 노트북, Delta Live Tables 파이프라인, 클러스터, Databricks SQL 대시보드, 웨어하우스 모델 등을 로드하고 시작합니다... dbdemos 사용 방법을 확인해 보세요.

 

Dbdemos는 GitHub 프로젝트로 배포됩니다.

자세한 내용은 GitHub README.md 파일 을 참조하고 문서를 따르십시오.
Dbdemos는 그대로 제공됩니다. 자세한 정보는 
라이선스 및 공지 를 참조하십시오.
Databricks는 dbdemos 및 관련 자산에 대한 공식 지원을 제공하지 않습니다.
문제가 발생한 경우 티켓을 열어주시면 데모 팀이 최선을 다해 살펴보겠습니다. 

권장

<p>Full Delta Live Tables Pipeline — Loan</p>

튜토리얼

Full Delta Live Tables Pipeline — Loan

<p>CDC Pipeline With Delta Live Tables</p>

튜토리얼

CDC Pipeline With Delta Live Tables

<p><span><span><span><span><span><span>Delta Lake</span></span></span></span></span></span></p>

튜토리얼

Delta Lake