주요 컨텐츠로 이동
<
Page 2
Engineering blog

SQL 함수의 명명된 인수(Named Arguments)

(번역: Youngkyong Ko) Original Blog Post 오늘은 SQL 함수에 명명된 인수(named arguments)를 사용할 수 있는 새로운 기능을 소개합니다. 이 기능을 사용하면 보다 유연한...
Engineering blog

Apache Spark ❤️ Apache DataSketches: Sketch 기반의 새로운 Approximate Distinct Counting

(번역: Youngkyong Ko) Original Blog Post 소개 이 블로그에서는 고유 값 계산, 스케치 병합, 고유 개수 추정을 정확하고 효율적으로 수행할 수 있도록 HyperLogLog...
Engineering blog

구조화된 스트리밍에서 복수 상태 저장 연산자 사용하기

August 11, 2023 작성자: Angela Chu, Jungtaek Lim in 엔지니어링 블로그
데이터 엔지니어링의 세계에는 ETL이 탄생할 때부터 사용되어 온 작업이 있습니다. 필터링과 조인(Join), 집계를 거쳐 마지막으로 결과를 저장하는 작업입니다. 이러한 데이터 작업은 오랜 시간동안...
Engineering blog

Delta Lake의 변경 데이터 피드로 CDC를 간소화하는 방법

Databricks에서 이 노트북을 사용해 보세요 변경 데이터 캡처(CDC) 는 많은 고객이 Databricks에서 구현하는 사용 사례이며, 이 주제에 대한 이전 심층 분석 은 여기에서...