주요 컨텐츠로 이동

Databricks 연구실

연구와 현실 세계가 만나는 곳

Join our team

좋은 기업, 좋은 동료들

Apache Spark. 레이크하우스. Mosaic MPT-7B. 이 시스템은 Databricks의 특별한 엔지니어 그룹에 의해 구축되었습니다.

Databricks의 설립자와 직원은 분산 시스템, 인공 지능 및 데이터 분석 분야에서 획기적인 발전을 이룸으로써 실력을 입증했습니다.

Databricks는 세상에 발자국을 남기고 싶은 인재를 찾고 있습니다. 진실을 추구하고, 데이터 기반으로 사고하는 여러분에게 Databricks가 있습니다.

논문

UC 버클리, 스탠포드 및 기타 주요 대학과 공동으로 진행한 최근 논문을 살펴보십시오.

46 결과 중 1 - 12 표시 중

애플리케이션

ADAM: 클라우드 스케일 컴퓨팅을 위한 유전체학 형식 및 처리 패턴

Matt Massie, Frank Nothaft, Christopher Hartl, Christos Kozanitis, André Schumacher, Anthony D. Joseph, David A. Patterson

PDF 다운로드
분산 시스템

Apache Spark: 빅데이터 처리를 위한 통합 엔진

Matei Zaharia, Reynold Xin, Patrick Wendell, Tathagata Das, Michael Armbrust, Ankur Dave, Xiangrui Meng, Josh Rosen, Shivaram Venkataraman, Michael J. Franklin, Ali Ghodsi, Joseph Gonzalez, Scott Shenker, Ion Stoica

PDF 다운로드
AI 및 ML

Apache Spark의 행렬 계산 및 최적화

Reza Bosagh Zadeh, Xiangrui Meng, Alexander Ulanov, Burak Yavuz, Li Pu, Shivaram Venkataraman, Evan Sparks, Aaron Staple, Matei Zaharia

PDF 다운로드
분산 시스템

ASAP: 빠르고 대략적인 대규모 그래프 패턴 마이닝

Anand Padmanabha Iyer, Zaoxing Liu, Xin Jin,, Shivaram Venkataraman, Vladimir Braverman, Ion Stoica

PDF 다운로드
애플리케이션

C3: 비디오 품질 최적화를 위한 인터넷 스케일 컨트롤 플레인

Aditya Ganjam, Junchen Jiang, Xi Liu, Vyas Sekar, Faisal Siddiqui, Ion Stoica, Jibin Zhan, Hui Zhang

PDF 다운로드
애플리케이션

CellIQ : 대규모 실시간 셀룰러 네트워크 분석

Anand Padmanabha Iyer, Li Erran Li, Ion Stoica

PDF 다운로드
분산 시스템

Chord: 인터넷 응용 프로그램을 위한 확장 가능한 피어 투 피어 조회 서비스

D. Karger, H. Balakrishnan, I. Stoica, M.F. Kaashoek, R. Morris

PDF 다운로드
AI 및 ML

Clipper: 대기 시간이 짧은 온라인 예측 서비스 시스템

Daniel Crankshaw, Xin Wang, Giulio Zhou, Michael J. Franklin, Joseph E. Gonzalez, Ion Stoica

PDF 다운로드
AI 및 ML

Compute-Efficient Deep Learning: Algorithmic Trends and Opportunities

Brian R. Bartoldson, Bhavya Kailkhura, Davis Blalock

Get the PDF
AI 및 ML

DAWNBench: 엔드 투 엔드 딥 러닝 벤치마크 및 경쟁

Cody Coleman, Deepak Narayanan, Daniel Kang, Tian Zhao, Jian Zhang, Luigi Nardi, Peter Bailis, Kunle Olukotun, Chris Ré, Matei Zaharia

PDF 다운로드
데이터베이스

Delta Lake: 클라우드 개체 저장소를 통한 고성능 ACID 테이블 스토리지

Michael Armbrust, Tathagata Das, Liwen Sun, Burak Yavuz, Shixiong Zhu, Mukul Murthy, Joseph Torres, Herman van Hovell, Adrian Ionescu, Alicja Łuszczak, Michał ́Switakowski, Michał Szafránsk, Xiao Li, Takuya Ueshin, Mostafa Mokhtar, Peter Boncz, Ali Ghodsi, Sameer Paranjpye, Pieter Senster, Reynold Xin, Matei Zaharia

PDF 다운로드
분산 시스템

Discretized Streams: Fault-Tolerant 스트리밍 Computation at Scale

Matei Zaharia, Tathagata Das, Haoyuan Li, Timothy Hunter, Sc, Tathagata Das, Haoyuan Li, Timothy Hunter, Scott Shenker, Ion Stoica

PDF 다운로드

46 결과 중 1 - 12 표시 중

Build your career

이제 ,학업을 넘어 경력을 쌓으세요

인재상: 확장 가능성, 안정성 및 고성능 시스템을 구축한 경험이 있는 박사 학위 소지자

데이터, 분석, AI를 통합하는 개방형 레이크하우스 플랫폼에서 전체 데이터 수명 주기를 획기적으로 간소화하고 있습니다. Databricks에서는 수집부터 머신 러닝, 생성형 AI에 이르기까지 모든 분야에서 획기적인 발전을 이루고 데이터 분석에서 가장 널리 사용되는 오픈 소스 프로젝트를 수행할 수 있습니다. 이 작업에 흥미를 느낀다면, Databricks의 전문 엔지니어링 팀의 일원이 되는 것을 추천합니다.

Explore Databricks teams

Caching Team

Build the next-generation sharding, load balancing and caching solutions for Databricks to enable low latency, efficiency and scalability in our systems.

Photon Team

Build Databricks’ high-performance native (C++), vectorized SQL execution engine, which powers petabytes of query processing at Databricks per day.

Query Optimization Team

Build systems that optimize diverse workloads. Innovate with all variety of techniques — from traditional to ML — to outperform specialized data warehouses.

Lakestore Team

Build best-in-class storage systems with the usability and performance of data warehouses, and the flexibility and scalability of data lakes for all data workloads.

Explore MosaicML teams

Research Science

Drive ambitious research projects that:

  • Push the limits of existing technology 
  • Explore new approaches that go beyond the state of the art

Survey publications and develop methods for efficient neural network training.

Engineering

Design and implement our ML infrastructure and generative AI platform. Establish development best practices. Help develop infrastructure and platforms that analyze ML training jobs, predict performance and cost, and run them across various hardware.

최근 기사 작성에 참여한 현직 Databricks 직원들을 만나보세요


스탠포드에서 컴퓨터 시스템 박사 학위 취득 후 소프트웨어 엔지니어로 근무하는 일상

직장에서의 창의성, 개인의 발전, Databricks 내 동료/멘토 네트워크에 대한 Shoumik Palkar의 생각을 들어보세요.

기사 읽기