주요 컨텐츠로 이동
<
Page 2
>
Engineering blog

Apache Spark Structured Streaming에서 상태 유지(stateful) 파이프라인의 최신 성능 향상에 대한 심층 분석

(번역: Youngkyong Ko) Original Post 이 글은 상태 유지(stateful) 파이프라인의 최신 성능 개선에 대해 2부로 구성된 시리즈 중 두 번째 파트입니다. 이 글을...
Engineering blog

Apache Spark Structured Streaming에서 상태 유지 파이프라인(Stateful pipeline)의 성능 개선

(번역: Youngkyong Ko) Original Post 소개 Apache Spark™ Structured Streaming 은 확장성과 내결함성을 제공하는 인기 있는 오픈 소스 스트림 처리 플랫폼으로, Spark SQL...
Platform blog

데이터브릭스는 고객의 AI 성공을 위해 새로운 마이그레이션 Brickbuilder 솔루션을 추가합니다

March 10, 2024 작성자: Christine Gauthier in 파트너
(번역: Youngkyong Ko) Original Post 지난 2년 동안 데이터브릭스는 선도적인 컨설팅 파트너와 협력하여 산업, 마이그레이션, 데이터 및 AI 사용 사례를 위한 혁신적인 솔루션을...
Engineering blog

델타 레이크에 대한 스트리밍 데이터 수집 간소화

March 5, 2024 작성자: Sachin Patil in 엔지니어링 블로그
Translated by HaUn Kim - Original Blog Post 대부분의 비즈니스 의사결정은 시간에 민감하며, 여러 종류의 소스에서 실시간 데이터를 활용해야 합니다. 적절한 시기에 적절한...
Engineering blog

매출 예측 및 어트리뷰션으로 광고 효과 측정하기

Translated by HaUn Kim - Original Blog Post 노트북을 다운로드하고, 이 솔루션 액셀러레이터에 관한 웨비나를 확인해 보세요. 마케팅과 광고 지출이 어떻게 매출 증가에...
Engineering blog

데이터브릭스 AutoML을 통한 예측 간소화

March 4, 2024 작성자: Justin Kim, Lu Wang in 엔지니어링 블로그
Translated by HaUn Kim - Original Blog Post 작년에는 분류와 회귀를 위한 데이터브릭스 AutoML이라는 도구 를 발표하며, 데이터 팀의 역량 강화에 있어 '블랙...
Platform blog

레이크하우스 모니터링: 데이터 품질과 AI를 위한 통합 솔루션

Introduction 데이터브릭스 레이크하우스 모니터링 을 사용하면 추가 툴이나 복잡한 과정 없이 데이터부터 기능, ML 모델에 이르는 모든 데이터 파이프라인을 모니터링할 수 있습니다. Unity...
Engineering blog

Apache Spark™ 3.5의 Arrow에 최적화된 Python UDF

(번역: Youngkyong Ko) Original Blog Post Apache Spark™에서 Python 사용자 정의 함수(UDF)는 가장 인기 있는 기능 중 하나입니다. 이 기능을 통해 사용자는 고유한...
Engineering blog

PySpark의 매개변수화 쿼리 (Parameterized queries)

(번역: Leah Seo) Original Blog Post PySpark는 언제나 데이터 쿼리를 위한 훌륭한 SQL 및 Python API를 제공해 왔습니다. Databricks Runtime 12.1 과 Apache...
Engineering blog

AI 기반의 문서화를 위한 맞춤형 LLM 만들기

(번역: Youngkyong Ko) Original Blog Post 우리는 최근 대규모 언어 모델(LLM)을 사용하여 Unity Catalog의 테이블과 열에 대한 문서를 자동으로 생성하는 AI 기반의 문서화...