メインコンテンツへジャンプ

Databricks でのリサーチ

研究と実社会の接点

Join our team

環境に恵まれた職場です

Apache Spark、レイクハウス、Mosaic MPT-7B。これらのシステムは、Databricks の優秀なエンジニアたちによって構築されました。

Databricks の創設者とスタッフは、分散システム、AI(人工知能)、データ分析において画期的な成果を上げてきた実績があります。

私たちは今、インパクトをもたらす博士号取得者を探しています。真実を追求し、データドリブンで、第一原理に基づいて仕事をする人にとって、Databricks は最適な場所です。

出版物

カリフォルニア大学バークレー校、スタンフォード大学、その他の一流大学との共同研究の最新論文をご覧ください。

46 の結果のうち 1 - 12 を表示しています

アプリケーション

ADAM: ゲノミクス クラウド規模のコンピューティングのためのフォーマットと処理パターン

Matt Massie, Frank Nothaft, Christopher Hartl, Christos Kozanitis, André Schumacher, Anthony D. Joseph, David A. Patterson

PDFを入手する
AI と機械学習

Apache Spark での行列計算と最適化

Reza Bosagh Zadeh, Xiangrui Meng, Alexander Ulanov, Burak Yavuz, Li Pu, Shivaram Venkataraman, Evan Sparks, Aaron Staple, Matei Zaharia

PDFを入手する
分散システム

Apache Spark: ビッグデータ処理のための統合エンジン

Matei Zaharia, Reynold Xin, Patrick Wendell, Tathagata Das, Michael Armbrust, Ankur Dave, Xiangrui Meng, Josh Rosen, Shivaram Venkataraman, Michael J. Franklin, Ali Ghodsi, Joseph Gonzalez, Scott Shenker, Ion Stoica

PDFを入手する
分散システム

ASAP:大規模で高速な近似グラフパターンマイニング

Anand Padmanabha Iyer, Zaoxing Liu, Xin Jin,, Shivaram Venkataraman, Vladimir Braverman, Ion Stoica

PDFを入手する
アプリケーション

C3:ビデオ品質最適化のためのインターネットスケールコントロールプレーン

Aditya Ganjam, Junchen Jiang, Xi Liu, Vyas Sekar, Faisal Siddiqui, Ion Stoica, Jibin Zhan, Hui Zhang

PDFを入手する
アプリケーション

CellIQ : リアルタイム Cellular Network アナリティクス at Scale

Anand Padmanabha Iyer, Li Erran Li, Ion Stoica

PDFを入手する
AI と機械学習

Compute-Efficient Deep Learning: Algorithmic Trends and Opportunities

Brian R. Bartoldson, Bhavya Kailkhura, Davis Blalock

Get the PDF
AI と機械学習

DAWNBench:エンドツーエンドのディープラーニングベンチマークと競争

Cody Coleman, Deepak Narayanan, Daniel Kang, Tian Zhao, Jian Zhang, Luigi Nardi, Peter Bailis, Kunle Olukotun, Chris Ré, Matei Zaharia

PDFを入手する
データベース

Delta Lake:クラウドオブジェクトストアを介した高性能 ACID テーブルストレージ

Michael Armbrust, Tathagata Das, Liwen Sun, Burak Yavuz, Shixiong Zhu, Mukul Murthy, Joseph Torres, Herman van Hovell, Adrian Ionescu, Alicja Łuszczak, Michał ́Switakowski, Michał Szafránsk, Xiao Li, Takuya Ueshin, Mostafa Mokhtar, Peter Boncz, Ali Ghodsi, Sameer Paranjpye, Pieter Senster, Reynold Xin, Matei Zaharia

PDFを入手する
分散システム

Drizzle:高速で適応性のあるストリーム処理を大規模に

Shivaram Venkataraman, Aurojit Panda, Kay Ousterhout, Michael Armbrust, Ali Ghodsi, Michael J. Franklin, Benjamin Recht, Ion Stoica

PDFを入手する
AI と機械学習

Dynamic Masking Rate Schedules for MLM Pretraining

Zachary Ankner, Davis Blalock, Jonathan Frankle, Matthew L. Leavitt

Get the PDF
AI と機械学習

Fast Benchmarking of Accuracy vs. Training Time With Cyclic Learning Rates

Jacob Portes, Davis Blalock, Cory Stephenson, Jonathan Frank

Get the PDF

46 の結果のうち 1 - 12 を表示しています

Build your career

学問の枠を超えてキャリアを築く

求む:スケーラブルで信頼性が高く、パフォーマンスの高いシステムの構築に長けた博士号取得者

Databricks は、データ、分析、AI を統合するオープンなレイクハウスプラットフォームで、データのライフサイクル全体を根本的に簡素化します。ここでは、インジェストから機械学習、ジェネレーティブ AI まで、あらゆる分野における画期的な進歩や、データ分析で最も広く利用されているオープンソースプロジェクトに取り組むことができます。このような仕事に興味をお持ちの方には、Databricks の専門エンジニアリングチームが最適です。

Explore Databricks teams

Caching Team

Build the next-generation sharding, load balancing and caching solutions for Databricks to enable low latency, efficiency and scalability in our systems.

Photon Team

Build Databricks’ high-performance native (C++), vectorized SQL execution engine, which powers petabytes of query processing at Databricks per day.

Query Optimization Team

Build systems that optimize diverse workloads. Innovate with all variety of techniques — from traditional to ML — to outperform specialized data warehouses.

Lakestore Team

Build best-in-class storage systems with the usability and performance of data warehouses, and the flexibility and scalability of data lakes for all data workloads.

Explore MosaicML teams

Research Science

Drive ambitious research projects that:

  • Push the limits of existing technology 
  • Explore new approaches that go beyond the state of the art

Survey publications and develop methods for efficient neural network training.

Engineering

Design and implement our ML infrastructure and generative AI platform. Establish development best practices. Help develop infrastructure and platforms that analyze ML training jobs, predict performance and cost, and run them across various hardware.

チーム

最近の出版物を手がけた Databricks の現役従業員をご紹介します。


スタンフォード大学でコンピュータシステムの博士号を取得後、ソフトウェアエンジニアとしてキャリアを築く

仕事における創造性、個人の成功の検証、Databricks のピアメンターネットワークに関するシュミク・パルカーの考えをお聞きください。

記事を読む