Deep Learning Solutions – Databricks

Deep learning avec Databricks

Données complexes, opportunités extraordinaires

Le deep learning représente le meilleur moyen de fournir des solutions d'analyses prédictives dans un cadre big data, à mesure que le volume et la complexité des données continuent de croître et que naît le besoin de plus de puissance de calcul et de processeurs graphiques plus élaborés.

Grâce au deep learning, les entreprises sont en mesure de tirer parti de la puissance de données non structurées telles que les images, le texte et la voix pour fournir des cas d'utilisation capables de changer les choses en profondeur en exploitant des techniques telles que l'IA, l'interprétation d'images, la traduction automatique, le traitement automatique du langage naturel etc.

Cas d'utilisation courants

CLASSIFICATION D'IMAGES
Reconnaître et catégoriser des images pour un classement facilité et une recherche plus précise.
DÉTECTION D'OBJETS
Détection rapide d'objets pour faire des voitures autonomes et de la reconnaissance faciale une réalité.
TRAITEMENT AUTOMATIQUE DU LANGAGE NATUREL
Comprendre correctement la langue parlée pour alimenter de nouveaux outils tels que la reconnaissance vocale et la domotique.

Les défis du deep learning

Si le Big Data et l'IA disposent d'un potentiel considérable, extraire des informations exploitables de ces big data n'a rien de trivial. Le corpus d'informations, de plus en plus énorme, que renferment les données non structurées (images, sons, texte etc.) nécessite à la fois que soient développées des technologies poussées et que des équipes interdisciplinaires — data engineering, data science et métier — travaillent en étroite collaboration.

TECHNOLOGIES SANS COHÉRENCE
Appui sur des infrastructures et outils distincts (TensorFlow, Keras, PyTorch, MXNet, Caffe, CNTK, Thano) qui proposent des API détaillées à la courbe d'apprentissage particulièrement raide.
INFRASTRUCTURE COÛTEUSE
La fourniture d'une infrastructure apte à prendre en charge le deep learning peut mobiliser des ressources considérables et une puissance de calcul à l'avenant.
COMPLEXITÉ DE LA DATA SCIENCE
L'entraînement d'un modèle de deep learning correct peut demander aux data scientists beaucoup de travail manuel, avec notamment beaucoup d'étiquetage de données et des paramètres à affiner constamment.

Démocratiser le deep learning

La plateforme d'analyse unifiée Databricks basée sur Apache Spark™ vous permet de créer des pipelines de deep learning fiables, performants et évolutifs pour que les data scientists puissent concevoir, entraîner et déployer leurs applications de deep learning en toute simplicité.

INFRASTRUCTURE UNIFIÉE
Infrastructure cloud entièrement administrée et sans serveur pour garantir isolation, maîtrise des coûts et flexibilité.Provides an interactive environment to make it easy to work with major frameworks such as TensorFlow, Keras, PyTorch, MXNet, Caffe, CNTK, and Theano. Fournit un environnement interactif pour que faciliter l'utilisation des principaux frameworks tels que TensorFlow, Keras, PyTorch, MXNet, Caffe, CNTK et Theano.
FLUX DE TRAVAIL DE BOUT EN BOUT
Une seule plateforme pour gérer la préparation des données, l'exploration, l'entraînement des modèles et les prédictions à grande échelle. Des API générales et des exemples d'applications vous permettent de tirer facilement profit de modèles de dernière génération.
OPTIMISÉ POUR LA PERFORMANCE
Un runtime Databricks basé sur Apache Spark et conçu pour s'exécuter sur des GPU puissants à n'importe quelle échelle.
DATA SCIENCE INTERACTIVE
Collaborez avec votre équipe sur plusieurs langages de programmation à la fois pour explorer les données et entraîner des modèles de deep learning sur des ensembles de données en temps réel.

Cas d'utilisation clients

Hotels.com classifie les images pour améliorer les taux d'engagement et de conversion et multiplie sa capacité de traitement par 20 tout en exploitant 100 % de son ensemble de données pour ses modèles.  Vidéo

Giphy utilise Databricks pour comprendre diverses propriétés des images (scène, mots clés, couleurs, etc.) sur des dizaines de millions de GIF pour fournir de meilleurs résultats de recherche et des recommandations plus fines.

Voicebox utilise le traitement automatique du langage naturel pour identifier des contextes au sein des conversations humaines afin de fournir des applications d'IA plus intelligentes, par exemple des appareils à contrôle vocal et des assistants personnels.

Avec Databricks, Riot Games a la capacité de comprendre et de détecter les propos agressifs au sein même des parties de jeu vidéo, en temps réel, ce qui lui a permis d'améliorer la satisfaction, la fidélité et donc la valeur vie client. Vidéo