Fiabilité et performances pour les data lakes
Delta Lake apporte fiabilité et évolutivité à votre datalake existant, par le biais d'une couche de stockage transactionnelle open source prenant en charge le cycle de vie complet des données. En savoir plus sur Delta Lake.
Traitement simplifié des données sur une infrastructure qui s'adapte de façon automatique. Propulsés par une infrastructure Apache Spark™ hautement optimisée, pour des gains de performance jusqu'à 50 fois supérieurs. En savoir plus sur Apache Spark.
Collaboration tout au long du cycle de vie de la Data Science et du Machine Learning
Obtenez et explorez rapidement les données, repérez et partagez de nouvelles informations puis collaborez pour concevoir des modèles à l'aide de vos langages et outils de prédilection. En savoir plus sur les notebooks.
Accès en un clic à des environnements ML préconfigurés pour exploiter le machine learning augmenté grâce aux infrastructures ML modernes et populaires.
En savoir plus sur le runtime ML.
Suivez et partagez des tests, reproduisez des déploiements et gérez des modèles en collaborant à partir d'un référentiel central, de la phase de test à la production.
En savoir plus sur MLflow.
More complete and recent data to drive insights for every team
Exécutez des workloads SQL directement sur votre data lake pour requêter et analyser vos données les plus récentes avec un rapport prix/performance jusqu'à 9 fois plus avantageux que les Cloud Data Warehouses traditionnels.
Visualisez rapidement et facilement les résultats des requêtes et affichez le tout sur des tableaux de bord pour partager les informations en temps réel avec votre équipe tout en étant automatiquement averti des changements critiques, au moyen d'alertes automatiques.
Use your preferred BI tools, like Tableau and Microsoft Power BI, with optimized connectors that provide fast performance, low latency, and high user concurrency to your data lake.
Une plateforme multi-cloud massivement sécurisée et scalable qui exécute des millions de machines chaque jour
Give all your users the right access to the right data with comprehensive audit trails by using your existing cloud security policies and identity management system to create compliant, private, and isolated workspaces. Learn more about Platform Security.
Faites rapidement évoluer vos workspaces collaboratifs pour n'importe quel projet tout en étant équipé des bons outils pour gérer l'accès des utilisateurs, contrôler les dépenses, auditer l'utilisation et analyser l'activité de chaque workspace, tout en appliquant de manière transparente la gouvernance des utilisateurs et des données.
En savoir plus sur l'administration 360°.
Use fully-configured data environments and API’s to quickly take initiatives from development to production. Once in production, data teams can use on-demand autoscaling to optimize performance and reduce down time of data pipelines and ML models in production by efficiently matching resources to demand. Learn more about Elastic Scalability.
Securely integrate a single platform into each cloud to enable your data teams to do data analytics and machine learning without asking your users to learn cloud-specific tools and processes. Learn more about Databricks for Microsoft Azure and Amazon Web Services.
Dans cet exposé, Jim Forsythe et Jan Neumann présentent l'infrastructure de données et de machine learning de Comcast, qui repose sur la plateforme d'analyse de données unifiées de Databricks. Comcast utilise Databricks pour entraîner et alimenter les modèles ML qui équipent ses produits, et pour mieux comprendre comment ces derniers sont utilisés.