주요 컨텐츠로 이동
Page 1

PySpark - 2023년 한 해를 돌아보며

(번역: Youngkyong Ko) Original Post 2023년에 출시된 Apache Spark 3.4와 3.5에서는 PySpark의 성능, 유연성, 사용 편의성을 개선하는 데 중점을 두었습니다. 이 블로그 게시물에서는...

Apache Spark™ 3.5의 Arrow에 최적화된 Python UDF

(번역: Youngkyong Ko) Original Blog Post Apache Spark™에서 Python 사용자 정의 함수(UDF)는 가장 인기 있는 기능 중 하나입니다. 이 기능을 통해 사용자는 고유한...

PySpark의 매개변수화 쿼리 (Parameterized queries)

(번역: Leah Seo) Original Blog Post PySpark는 언제나 데이터 쿼리를 위한 훌륭한 SQL 및 Python API를 제공해 왔습니다. Databricks Runtime 12.1 과 Apache...

Spark Connect의 Python 종속성 관리

December 22, 2023 작성자: Hyukjin Kwon, Ruifeng Zheng in
분산 컴퓨팅 환경에서 애플리케이션의 환경을 관리하는 것은 어려울 수 있습니다. 모든 노드가 코드를 실행하는 데 필요한 환경을 갖추고 있는지 확인하고 사용자 코드의 실제...

Apache Spark™ 3.5 소개

(번역: Sangbae Lim) Original Blog Post 오늘, 데이터브릭스 런타임 14.0에서 Apache Spark™ 3.5를 사용할 수 있다는 소식을 발표하게 되어 기쁘게 생각합니다. Spark 3.5...