Passa al contenuto principale

La ricerca in Databricks

Dove la ricerca incontra il mondo reale

Join our team

Sei in buona compagnia

Apache Spark. Lakehouse. Mosaic MPT-7B. Questi sistemi sono stati realizzati dagli ingegneri speciali che troverai in Databricks.

I nostri fondatori e il nostro staff vantano un solido curriculum nello sviluppo di sistemi distribuiti, intelligenza artificiale e analisi dei dati.

Ora cerchiamo titolari di un dottorato (PhD) come te che vogliono dare un contributo sostanziale. Se sei alla ricerca della verità, se ti fai guidare dai dati e lavori su concetti primitivi, Databricks è il posto che fa per te.

Pubblicazioni

Consulta i documenti recenti realizzati in collaborazione con le università di Berkeley, Stanford e altri istituti di alto livello

Visualizzazione di 1 - 12 su 46 risultati

AI e ML

Accelerare il ciclo di vita dell'apprendimento automatico con MLflow

Matei Zaharia, Andrew Chen, Aaron Davidson, Ali Ghodsi, Sue , Andrew Chen, Aaron Davidson, Ali Ghodsi, Sue Ann Hong, Andy Konwinski, Siddharth Murching, Tomas Nykodym, Paul Ogilvie, Mani Parkhe, Fen Xie, Corey Zumar, Databricks Inc.

Scarica il PDF
Applicazioni

ADAM: Formati e modelli di elaborazione della genomica per il cloud Scale Computing

Matt Massie, Frank Nothaft, Christopher Hartl, Christos Kozanitis, André Schumacher, Anthony D. Joseph, David A. Patterson

Scarica il PDF
Sistemi distribuiti

Apache Spark: Un motore unificato per l'elaborazione dei Big Data

Matei Zaharia, Reynold Xin, Patrick Wendell, Tathagata Das, Michael Armbrust, Ankur Dave, Xiangrui Meng, Josh Rosen, Shivaram Venkataraman, Michael J. Franklin, Ali Ghodsi, Joseph Gonzalez, Scott Shenker, Ion Stoica

Scarica il PDF
Sistemi distribuiti

ASAP: Estrazione veloce e approssimativa di modelli Graph a Scale

Anand Padmanabha Iyer, Zaoxing Liu, Xin Jin,, Shivaram Venkataraman, Vladimir Braverman, Ion Stoica

Scarica il PDF
Applicazioni

C3: Piano di controllo InternetScale per l'ottimizzazione della qualità video

Aditya Ganjam, Junchen Jiang, Xi Liu, Vyas Sekar, Faisal Siddiqui, Ion Stoica, Jibin Zhan, Hui Zhang

Scarica il PDF
AI e ML

Calcoli matriciali e ottimizzazione in Apache Spark

Reza Bosagh Zadeh, Xiangrui Meng, Alexander Ulanov, Burak Yavuz, Li Pu, Shivaram Venkataraman, Evan Sparks, Aaron Staple, Matei Zaharia

Scarica il PDF
Applicazioni

CellIQ: analisi della rete cellulare in tempo reale a Scale

Anand Padmanabha Iyer, Li Erran Li, Ion Stoica

Scarica il PDF
Sistemi distribuiti

Chord: Un servizio scalabile di ricerca Peer-to-Peer per applicazioni Internet

D. Karger, H. Balakrishnan, I. Stoica, M.F. Kaashoek, R. Morris

Scarica il PDF
AI e ML

Clipper: Un sistema di predizione online a bassa latenza

Daniel Crankshaw, Xin Wang, Giulio Zhou, Michael J. Franklin, Joseph E. Gonzalez, Ion Stoica

Scarica il PDF
AI e ML

Compute-Efficient Deep Learning: Algorithmic Trends and Opportunities

Brian R. Bartoldson, Bhavya Kailkhura, Davis Blalock

Get the PDF
AI e ML

DAWNBench: Un benchmark e una competizione end-to-end per l'apprendimento profondo

Cody Coleman, Deepak Narayanan, Daniel Kang, Tian Zhao, Jian Zhang, Luigi Nardi, Peter Bailis, Kunle Olukotun, Chris Ré, Matei Zaharia

Scarica il PDF
Banche dati

Delta Lake: Archiviazione di tabelle ACID ad alte prestazioni su archivi di oggetti nel cloud

Michael Armbrust, Tathagata Das, Liwen Sun, Burak Yavuz, Shixiong Zhu, Mukul Murthy, Joseph Torres, Herman van Hovell, Adrian Ionescu, Alicja Łuszczak, Michał ́Switakowski, Michał Szafránsk, Xiao Li, Takuya Ueshin, Mostafa Mokhtar, Peter Boncz, Ali Ghodsi, Sameer Paranjpye, Pieter Senster, Reynold Xin, Matei Zaharia

Scarica il PDF

Visualizzazione di 1 - 12 su 46 risultati

Build your career

Fai carriera dopo l'università

Cerchiamo PhD con competenze nella costruzione di sistemi scalabili e affidabili con prestazioni avanzate

Databricks sta semplificando drasticamente l'intero ciclo di vita dei dati sulla propria piattaforma lakehouse aperta che unifica dati, analisi e AI. Nella nostra azienda potrai lavorare su sviluppi rivoluzionari per tutti gli aspetti dall'acquisizione, al machine learning e all'AI generativa, oltre ai progetti open-source più utilizzati nell'analisi dei dati. Se questo lavoro ti interessa, potremmo avere un posto per te in uno dei nostri team di ingegneri specializzati.

Explore Databricks teams

Caching Team

Build the next-generation sharding, load balancing and caching solutions for Databricks to enable low latency, efficiency and scalability in our systems.

Photon Team

Build Databricks’ high-performance native (C++), vectorized SQL execution engine, which powers petabytes of query processing at Databricks per day.

Query Optimization Team

Build systems that optimize diverse workloads. Innovate with all variety of techniques — from traditional to ML — to outperform specialized data warehouses.

Lakestore Team

Build best-in-class storage systems with the usability and performance of data warehouses, and the flexibility and scalability of data lakes for all data workloads.

Explore MosaicML teams

Research Science

Drive ambitious research projects that:

  • Push the limits of existing technology 
  • Explore new approaches that go beyond the state of the art

Survey publications and develop methods for efficient neural network training.

Engineering

Design and implement our ML infrastructure and generative AI platform. Establish development best practices. Help develop infrastructure and platforms that analyze ML training jobs, predict performance and cost, and run them across various hardware.

Team

Ti presentiamo alcuni dei dipendenti di Databricks che hanno contribuito alle nostre pubblicazioni recenti


La vita di un ingegnere software dopo un dottorato in sistemi informatici a Stanford

Ascolta le riflessioni di Shoumik Palkar sulla creatività sul lavoro, sulla convalida del successo personale e sulla rete di colleghi/mentori in Databricks.

Leggi l'articolo