La ricerca in Databricks

Dove la ricerca incontra il mondo reale

Sei in buona compagnia

Apache Spark. Lakehouse. Mosaic MPT-7B. Questi sistemi sono stati realizzati dagli ingegneri speciali che troverai in Databricks.

I nostri fondatori e il nostro staff vantano un solido curriculum nello sviluppo di sistemi distribuiti, intelligenza artificiale e analisi dei dati.

Ora cerchiamo titolari di un dottorato (PhD) come te che vogliono dare un contributo sostanziale. Se sei alla ricerca della verità, se ti fai guidare dai dati e lavori su concetti primitivi, Databricks è il posto che fa per te.

Unisciti a noi

Pubblicazioni

Consulta i documenti recenti realizzati in collaborazione con le università di Berkeley, Stanford e altri istituti di alto livello

Hide filters

Dominio di ricerca

Ordine: A-Z

Visualizzazione di 1 - 12 su 48 risultati

AI e ML

Accelerare il ciclo di vita dell'apprendimento automatico con MLflow

Matei Zaharia, Andrew Chen, Aaron Davidson, Ali Ghodsi, Sue , Andrew Chen, Aaron Davidson, Ali Ghodsi, Sue Ann Hong, Andy Konwinski, Siddharth Murching, Tomas Nykodym, Paul Ogilvie, Mani Parkhe, Fen Xie, Corey Zumar, Databricks Inc.

Scarica il PDF

Applicazioni

ADAM: Formati e modelli di elaborazione della genomica per il cloud Scale Computing

Matt Massie, Frank Nothaft, Christopher Hartl, Christos Kozanitis, André Schumacher, Anthony D. Joseph, David A. Patterson

Scarica il PDF

Sistemi distribuiti

Apache Spark: Un motore unificato per l'elaborazione dei Big Data

Matei Zaharia, Reynold Xin, Patrick Wendell, Tathagata Das, Michael Armbrust, Ankur Dave, Xiangrui Meng, Josh Rosen, Shivaram Venkataraman, Michael J. Franklin, Ali Ghodsi, Joseph Gonzalez, Scott Shenker, Ion Stoica

Scarica il PDF

Applicazioni

app.build: A Production Framework for Scaling Agentic Prompt-to-App Generation with Environment Scaffolding

Evgenii Kniazev, Arseny Kravchenko, Igor Rekun, James Broadhead, Nikita Shamgunov, Pranav Sah, Pratik Nichite, Ivan Yamshchikov

Get the PDF

Sistemi distribuiti

ASAP: Estrazione veloce e approssimativa di modelli Graph a Scale

Anand Padmanabha Iyer, Zaoxing Liu, Xin Jin,, Shivaram Venkataraman, Vladimir Braverman, Ion Stoica

Scarica il PDF

AI e ML

BlackIce: A Containerized Red Teaming Toolkit for AI Security Testing

Caelin Kaplan, Alexander Warnecke, Neil Archibald

Get the PDF

Applicazioni

C3: Piano di controllo InternetScale per l'ottimizzazione della qualità video

Aditya Ganjam, Junchen Jiang, Xi Liu, Vyas Sekar, Faisal Siddiqui, Ion Stoica, Jibin Zhan, Hui Zhang

Scarica il PDF

AI e ML

Calcoli matriciali e ottimizzazione in Apache Spark

Reza Bosagh Zadeh, Xiangrui Meng, Alexander Ulanov, Burak Yavuz, Li Pu, Shivaram Venkataraman, Evan Sparks, Aaron Staple, Matei Zaharia

Scarica il PDF

Applicazioni

CellIQ: analisi della rete cellulare in tempo reale a Scale

Anand Padmanabha Iyer, Li Erran Li, Ion Stoica

Scarica il PDF

Sistemi distribuiti

Chord: Un servizio scalabile di ricerca Peer-to-Peer per applicazioni Internet

D. Karger, H. Balakrishnan, I. Stoica, M.F. Kaashoek, R. Morris

Scarica il PDF

AI e ML

Clipper: Un sistema di predizione online a bassa latenza

Daniel Crankshaw, Xin Wang, Giulio Zhou, Michael J. Franklin, Joseph E. Gonzalez, Ion Stoica

Scarica il PDF

AI e ML

Compute-Efficient Deep Learning: Algorithmic Trends and Opportunities

Brian R. Bartoldson, Bhavya Kailkhura, Davis Blalock

Get the PDF

Visualizzazione di 1 - 12 su 48 risultati

Fai carriera dopo l'università

Cerchiamo PhD con competenze nella costruzione di sistemi scalabili e affidabili con prestazioni avanzate

Databricks sta semplificando drasticamente l'intero ciclo di vita dei dati sulla propria piattaforma lakehouse aperta che unifica dati, analisi e AI. Nella nostra azienda potrai lavorare su sviluppi rivoluzionari per tutti gli aspetti dall'acquisizione, al machine learning e all'AI generativa, oltre ai progetti open-source più utilizzati nell'analisi dei dati. Se questo lavoro ti interessa, potremmo avere un posto per te in uno dei nostri team di ingegneri specializzati.

Explore Databricks teams

Caching Team

Build the next-generation sharding, load balancing and caching solutions for Databricks to enable low latency, efficiency and scalability in our systems.

Photon Team

Build Databricks’ high-performance native (C++), vectorized SQL execution engine, which powers petabytes of query processing at Databricks per day.

Query Optimization Team

Build systems that optimize diverse workloads. Innovate with all variety of techniques — from traditional to ML — to outperform specialized data warehouses.

Lakestore Team

Build best-in-class storage systems with the usability and performance of data warehouses, and the flexibility and scalability of data lakes for all data workloads.

See open roles

Explore MosaicML teams

Research Science

Drive ambitious research projects that:

Push the limits of existing technology
Explore new approaches that go beyond the state of the art

Survey publications and develop methods for efficient neural network training.

Engineering

Design and implement our ML infrastructure and generative AI platform. Establish development best practices. Help develop infrastructure and platforms that analyze ML training jobs, predict performance and cost, and run them across various hardware.

See open roles

Team

Ti presentiamo alcuni dei dipendenti di Databricks che hanno contribuito alle nostre pubblicazioni recenti

La vita di un ingegnere software dopo un dottorato in sistemi informatici a Stanford

Ascolta le riflessioni di Shoumik Palkar sulla creatività sul lavoro, sulla convalida del successo personale e sulla rete di colleghi/mentori in Databricks.

Leggi l'articolo