Revenir au contenu principal
Matei Zaharia

Matei Zaharia

Follow Matei Zaharia

Matei is the CTO and co-founder of Databricks and an Associate Professor of Computer Science at UC Berkeley. He started the Apache Spark project during his Ph.D. program at UC Berkeley in 2009 and has worked on other widely used data and AI software, including MLflow, Delta Lake, and DBRX. His most recent research is about combining large language models (LLMs) with external data sources, such as search systems, and improving their efficiency and result quality. Matei’s research was recognized through the 2014 ACM Doctoral Dissertation Award and the U.S. Presidential Early Career Award for Scientists and Engineers (PECASE).

Matei Zaharia's posts

Spark Declarative Pipelines: Why Data Engineering Needs to Become End-to-End Declarative

Annonces

23 février 2026/8 min de lecture

Pipelines déclaratifs Spark : pourquoi l'ingénierie des données doit devenir déclarative de bout en bout

Data Intelligence Platforms

Annonces

15 novembre 2023/9 min de lecture

Data Intelligence Platform

Predictive Optimization: Faster Queries, Cheaper Storage, No Sweat

Solutions

26 octobre 2023/5 min de lecture

Présentation de l'optimisation prédictive : des requêtes plus rapides, un stockage moins cher, sans effort

Entreposage des données

28 juin 2023/6 min de lecture

Des capacités de fédération de lakehouses pour Unity Catalog

Latency goes subsecond in Apache Spark Structured Streaming

Streaming de données

15 mai 2023/15 min de lecture

La latence passe sous la seconde dans Apache Spark Structured Streaming

Hello Dolly: Democratizing the magic of ChatGPT with open models

Actualités

24 mars 2023/12 min de lecture

Hello Dolly : démocratiser la magie de ChatGPT avec les modèles ouverts

Announcing General Availability of Delta Sharing

Annonces

26 août 2022/7 min de lecture

Annonce de la disponibilité générale du partage Delta

db-233-clean-rooom-og

Annonces

28 juin 2022/8 min de lecture

Découvrez les salles blanches pour le lakehouse

acm-sigmod-blog-og-new

Actualités

15 juin 2022/6 min de lecture

Apache Spark et Photon reçoivent des prix SIGMOD

Data Intelligence Platforms

Produit

14 janvier 2022/8 min de lecture

Les trois principaux cas d'usage du partage de données avec Delta Sharing

Delta-Sharing-Social

Annonces

26 mai 2021/8 min de lecture

Delta Sharing : une norme ouverte pour le partage de données sécurisé

spark-og2

Annonces

18 juin 2020/10 min de lecture

Présentation d'Apache Spark 3.0

Affichage de 1 - 12 sur 13 des résultats