Revenir au contenu principal

Model Training

Fine-tunez et entraînez vos propres LLM et autres modèles d'IA générative

Fine-tunez un LLM open source ou créez des LLM personnalisés en puisant dans vos données d'entreprise avec Mosaic AI Model Training. Les modèles personnalisés créés avec Model Training sont plus rapides, produisent des résultats de qualité supérieure et spécifiques à un domaine. Surtout, leur coût est dix fois inférieur à celui des LLM propriétaires.

A complex image with various elements, including text, diagrams, and charts.

Une précision supérieure

L'utilisation des données de l'entreprise dans le fine-tuning d'un LLM open source ou la création d'un LLM permet d'atteindre une meilleure compréhension sémantique de l'entreprise et produit des réponses d'une grande précision. Mosaic AI Model Training étant disponible nativement dans Databricks, les organisations peuvent facilement ajuster ou créer des modèles en toute sécurité, sans déplacer leurs données. Elles bénéficient également de toutes les fonctions de gouvernance, d'auditabilité, de traçabilité et de supervision qui garantissent le bon usage des modèles et la qualité des réponses. Elles obtiennent ainsi des résultats précis et de meilleure qualité, adaptés à leur contexte métier.

Pretraining compute plane graphic image

Évolutivité sans effort

L'évolutivité est un facteur essentiel pour la performance de l'entraînement d'un LLM, qui nécessite à la fois un réseau rapide à faible latence et l'accès aux GPU les plus performants. Mosaic AI Model Training vous donne automatiquement accès aux deux : un réseau NVIDIA InfiniBand et des GPU NVIDIA H100 Tensor Core, les GPU les plus puissants de NVIDIA. Résultat : des performances inégalées à une échelle sans précédent par comparaison à la précédente génération de matériel. Vous disposez ainsi de la capacité nécessaire pour entraîner sans difficulté de grands modèles (plus de 70 milliards de paramètres) et achever des cycles d'entraînement en quelques heures plutôt qu'en plusieurs jours.

Pretraining shows it can train a Stable Diffusion model for 10x less cost

Rentable

Mosaic AI Model Training peut fine-tuner des LLM d'IA générative open source plus modestes pour produire des modèles d'une grande efficacité, dont le service peut être jusqu'à 5 fois plus économique que celui des LLM propriétaires. Vous pouvez aussi créer des LLM complets à l'aide d'une pile logicielle optimisée qui rend leur entraînement particulièrement économique. Grâce à une combinaison d'optimisations système, de stratégies de parallélisme fines et de science de l'entraînement des modèles, le coût de l'entraînement est divisé par 10.

model training architecture

SÉCURISÉ ET CONFORME

La sécurité est essentielle pour la plupart des organisations. Celles-ci ne peuvent en effet pas autoriser leurs collaborateurs à envoyer des données à une API tierce, au risque de les voir divulguées ou utilisées pour entraîner un modèle public. Tout cela est impossible avec Mosaic AI Model Training. Chaque organisation va en effet pouvoir créer son propre LLM et conserver un contrôle total sur les données et le modèle. Tout est chiffré par défaut, trafic et données d'entraînement inclus. Cela garantit une confidentialité complète des données et un contrôle total sur le modèle, en conformité avec les réglementations les plus strictes.

Prêt à vous lancer ?