Revenir au contenu principal

FAQ de Databricks

Notions de base

L'entreprise sait que les données cachent un véritable trésor, et la mission de votre équipe est de le trouver. Mais il est difficile de jouer les détectives avec un paquet d'outils mal conçus et une infrastructure pénible à installer. Vous voulez devenir le héros capable de comprendre tout ce qui se passe dans l'entreprise, mais vous passez l'essentiel de votre temps à vous battre avec vos outils.

Nous avons conçu Databricks pour simplifier le big data. Apache Spark™ a effectué une avancée considérable dans cette direction en fournissant une infrastructure unifiée pour la conception de pipelines de données. Databricks pousse le concept plus loin en fournissant une plateforme de cloud sans gestion requise, conçue sur une base Spark et proposant 1) des grappes Spark entièrement managées, 2) un espace de travail interactif pour l'exploration et la visualisation, 3) un planificateur de pipelines de production et enfin 4) une plateforme pour alimenter vos applications préférées basées sur Spark. Ainsi, au lieu d'être un sujet de migraines, les données vous permettent enfin de vous concentrer sur la recherche de solutions à l'effet immédiatement mesurable pour votre entreprise.

Disponibilité

La tarification de Databricks est détaillée sur notre page de tarification.

Questions techniques

Actuellement, Databricks prend en charge l'envoi de fichiers par navigateur, la récupération de données depuis Azure Blob Storage, AWS S3, Azure SQL Data Warehouse, Azure Data Lake Storage, les banques de données NoSQL telles que Cosmos DB, Cassandra, Elasticsearch, les sources de données JDBC, HDFS, Sqoop et diverses autres sources de données prises en charge nativement par Apache Spark.

Déploiement

Databricks est actuellement disponible sur Microsoft Azure, Amazon AWS et Google Cloud.

Sécurité

Les données des utilisateurs de Databricks sont lues depuis et persistent dans leurs propres dépôts de données, avec leurs propres identifiants.