주요 컨텐츠로 이동
Page 1
Engineering blog

새로운 "Statestore" 데이터 소스인 State Reader API를 소개합니다

(번역: Youngkyong Ko) Original Post 데이터브릭스 런타임 14.3에는 사용자가 구조화된 스트리밍 의 내부 상태 데이터에 액세스하고 분석할 수 있는 새로운 기능인 State Reader...
Engineering blog

Apache Spark™ 3.5 소개

(번역: Sangbae Lim) Original Blog Post 오늘, 데이터브릭스 런타임 14.0에서 Apache Spark™ 3.5를 사용할 수 있다는 소식을 발표하게 되어 기쁘게 생각합니다. Spark 3.5...
Engineering blog

구조화된 스트리밍에서 복수 상태 저장 연산자 사용하기

August 11, 2023 작성자: Angela Chu, Jungtaek Lim in 엔지니어링 블로그
데이터 엔지니어링의 세계에는 ETL이 탄생할 때부터 사용되어 온 작업이 있습니다. 필터링과 조인(Join), 집계를 거쳐 마지막으로 결과를 저장하는 작업입니다. 이러한 데이터 작업은 오랜 시간동안...