Ir para o conteúdo principal

Pesquisa na Databricks

Onde a pesquisa encontra o mundo real

Join our team

Você está em boa companhia

Apache Spark. Lakehouse. Mosaic MPT-7B. Esses sistemas foram criados pela geração especial de engenheiros que você encontrará na Databricks.

Nossos fundadores e funcionários têm um histórico comprovado de avanços em sistemas distribuídos, inteligência artificial e análise de dados.

Agora, estamos procurando PhDs como você que queiram causar impacto. Se você está buscando verdades, é data-driven e trabalha a partir dos primeiros princípios, a Databricks é o lugar certo para você.

Publicações

Conheça nossos artigos recentes em colaboração com a UC Berkeley, Stanford e outras universidades líderes

Exibição 1 - 12 of 46 resultados

IA e ML

Acelerando o ciclo de vida do aprendizado de máquina com MLflow

Matei Zaharia, Andrew Chen, Aaron Davidson, Ali Ghodsi, Sue , Andrew Chen, Aaron Davidson, Ali Ghodsi, Sue Ann Hong, Andy Konwinski, Siddharth Murching, Tomas Nykodym, Paul Ogilvie, Mani Parkhe, Fen Xie, Corey Zumar, Databricks Inc.

Obtenha o PDF
Sistemas distribuídos

acima das clouds: Uma view das clouds Computação

Michael Armbrust, Armando Fox, Rean Griffith, Anthony D. Joseph, Randy Katz, Andy Konwinski, Gunho Lee, David Patterson, Ariel Rabkin, Ion Stoica, Matei Zaharia

Obtenha o PDF
Aplicações

ADAM: Formatos genomics e padrões de processamento para clouds escala Computing

Matt Massie, Frank Nothaft, Christopher Hartl, Christos Kozanitis, André Schumacher, Anthony D. Joseph, David A. Patterson

Obtenha o PDF
Sistemas distribuídos

Apache Spark: um mecanismo unificado para processamento big data

Matei Zaharia, Reynold Xin, Patrick Wendell, Tathagata Das, Michael Armbrust, Ankur Dave, Xiangrui Meng, Josh Rosen, Shivaram Venkataraman, Michael J. Franklin, Ali Ghodsi, Joseph Gonzalez, Scott Shenker, Ion Stoica

Obtenha o PDF
Sistemas distribuídos

ASAP: Mineração rápida e aproximada de padrões gráficos em escala

Anand Padmanabha Iyer, Zaoxing Liu, Xin Jin,, Shivaram Venkataraman, Vladimir Braverman, Ion Stoica

Obtenha o PDF
Aplicações

C3: Plano de controle em escala de Internet para otimização da qualidade de vídeo

Aditya Ganjam, Junchen Jiang, Xi Liu, Vyas Sekar, Faisal Siddiqui, Ion Stoica, Jibin Zhan, Hui Zhang

Obtenha o PDF
Aplicações

CellIQ: análise de rede celular em tempo real em escala

Anand Padmanabha Iyer, Li Erran Li, Ion Stoica

Obtenha o PDF
Sistemas distribuídos

Chord: um serviço de pesquisa ponto a ponto escalonável para aplicativos de Internet

D. Karger, H. Balakrishnan, I. Stoica, M.F. Kaashoek, R. Morris

Obtenha o PDF
IA e ML

Clipper: um sistema de previsão on-line de baixa latência

Daniel Crankshaw, Xin Wang, Giulio Zhou, Michael J. Franklin, Joseph E. Gonzalez, Ion Stoica

Obtenha o PDF
IA e ML

Computações matriciais e otimização no Apache Spark

Reza Bosagh Zadeh, Xiangrui Meng, Alexander Ulanov, Burak Yavuz, Li Pu, Shivaram Venkataraman, Evan Sparks, Aaron Staple, Matei Zaharia

Obtenha o PDF
IA e ML

Compute-Efficient Deep Learning: Algorithmic Trends and Opportunities

Brian R. Bartoldson, Bhavya Kailkhura, Davis Blalock

Get the PDF
Sistemas distribuídos

Conjuntos de dados distribuídos resilientes: uma abstração tolerante a falhas para computação em clusters na memória

Matei Zaharia, Mosharaf Chowdhury, Tathagata Das, Ankur Dave, Justin Ma, Murphy McCauley, Michael J. Franklin, Scott Shenker, Ion Stoica

Obtenha o PDF

Exibição 1 - 12 of 46 resultados

Build your career

Desenvolva sua carreira além do âmbito acadêmico

Procura-se: PhDs especializados na criação de sistemas escaláveis, confiáveis e eficientes

A Databricks está simplificando radicalmente todo o ciclo de vida dos dados na nossa plataforma open lakehouse que unifica dados, análises e IA. É aqui que você pode trabalhar em avanços inovadores em tudo, desde a ingestão até o machine learning e IA generativa — e os projetos de código aberto mais usados em análise de dados. Se você se interessar por esse trabalho, talvez tenhamos um lugar para você em uma das nossas equipes especializadas de engenharia.

Explore Databricks teams

Caching Team

Build the next-generation sharding, load balancing and caching solutions for Databricks to enable low latency, efficiency and scalability in our systems.

Photon Team

Build Databricks’ high-performance native (C++), vectorized SQL execution engine, which powers petabytes of query processing at Databricks per day.

Query Optimization Team

Build systems that optimize diverse workloads. Innovate with all variety of techniques — from traditional to ML — to outperform specialized data warehouses.

Lakestore Team

Build best-in-class storage systems with the usability and performance of data warehouses, and the flexibility and scalability of data lakes for all data workloads.

Explore MosaicML teams

Research Science

Drive ambitious research projects that:

  • Push the limits of existing technology 
  • Explore new approaches that go beyond the state of the art

Survey publications and develop methods for efficient neural network training. 
 

Engineering

Design and implement our ML infrastructure and generative AI platform. Establish development best practices. Help develop infrastructure and platforms that analyze ML training jobs, predict performance and cost, and run them across various hardware.

Equipe

Conheça alguns dos funcionários atuais da Databricks por trás de algumas de nossas publicações recentes


Vida de engenheiro de software após um PhD em sistemas de computação em Stanford

Ouça os comentários de Shoumik Palar sobre criatividade no trabalho, validação do sucesso pessoal e a rede de colegas/mentores na Databricks.

Leia o artigo