Apache Spark-as-a-Service
Qu'est-ce qu'Apache Spark-as-a-Service ?
Apache Spark est un framework open source de calcul en cluster destiné au traitement rapide de données volumineuses en temps réel. Depuis sa création en 2009 au laboratoire AMPLab de l'Université de Californie à Berkeley, Spark a connu un développement majeur. Il est aujourd'hui soutenu par la plus grande communauté open source du secteur du big data et bénéficie des efforts de plus de 200 contributeurs issus de plus de 50 organisations. Databricks héberge sa version optimisée d'Apache Spark, Spark-as-a-Service, dans plusieurs clouds. Elle s'accompagne d'un ensemble d'applications intégrées conçues pour vous aider à accéder plus rapidement à vos données et les analyser. Elle s'appuie sur les grandes capacités de Spark en matière de traitement du big data : exploitation des données en streaming, calculs graphiques, SQL sur Hadoop et fonctionnalité de machine learning. Si la plupart des organisations sont conscientes des possibilités offertes par Spark, certaines rencontrent toujours des difficultés. Pourquoi ? À cause des défis liés à l'analyse de flux de données ou de grandes quantités de données. Il ne faut toutefois pas en conclure qu'il est impossible de profiter des avantages de Spart sans les investissements en matériel et la mise en œuvre à grande échelle.Spark as a Service vous affranchit des problématiques d'infrastructure et accélère le processus en éliminant une grande part des coûts et des efforts. Plusieurs fournisseurs proposent déjà Spark as a Service, ce qui simplifie beaucoup le déploiement de ce framework. Cette solution se prête particulièrement aux projets d'analytique à court terme, qui pourront être mis sur pied rapidement, avec une grande rentabilité. Spark-as-a-Service facilite le traitement et l'interrogation des données stockées dans Hive, HDFS, HBase et Amazon S3. Spark-as-a-Service est sans doute la meilleure option si vous devez exécuter un projet d'analytique temporaire. Mais il apporte également une réponse aux entreprises qui cherchent à évaluer les avantages du big data et de l'analytique avant d'investir massivement dans leur propre système de traitement.
Les principaux avantages de Spark-as-a-Service :
- Un moyen simple d'accéder aux données Spark
- Ne nécessite aucune compétence spécifique en code : utilisable aussi bien par les utilisateurs techniques que métier
- Des coûts plus faibles