Déploiement de LLMs sur Databricks Model Serving

Type

Vidéo à la demande

Durée

3 minutes

Contenu associé

SOCIAL

Les fondamentaux de l'IA générative

Apprenez les bases de l'IA générative et des grands modèles de langage (LLM) en 4 vidéos courtes.

Commencez la formation gratuite

Qu'allez-vous apprendre ?

Databricks Model Serving offre une solution unique pour déployer n'importe quel modèle IA sans avoir besoin de comprendre une infrastructure complexe. Cela signifie que vous pouvez déployer n'importe quel modèle de langage naturel, de vision, audio, tabulaire ou personnalisé, quel que soit la manière dont il a été formé - que ce soit construit à partir de zéro, provenant de sources open-source, ou affiné avec des données propriétaires. Il vous suffit de consigner votre modèle avec MLflow, et nous préparerons automatiquement un conteneur prêt pour la production avec des bibliothèques GPU comme CUDA et le déploierons sur des GPU sans serveur. Notre service entièrement géré s'occupera de tout le travail lourd pour vous, éliminant le besoin de gérer des instances, de maintenir la compatibilité des versions et de patcher les versions. Le service ajustera automatiquement les instances pour répondre aux modèles de trafic, économisant les coûts d'infrastructure tout en optimisant les performances de latence.

Recommandations

Vidéo à la demande

Data Science and Machine Learning on Databricks

Vidéo à la demande

Service de modèles sur le lakehouse

Ready to get started?

Try Databricks for free