Implementazione di LLM su Databricks Model Serving
Tipo
Video on-demand
Durata
3 minuti
Contenuti associati
Che cosa imparerai
Databricks Model Serving offre una soluzione unica per distribuire qualsiasi modello di intelligenza artificiale senza la necessità di comprendere un'infrastruttura complessa. Ciò significa che puoi implementare qualsiasi modello di linguaggio naturale, visione, audio, tabellare o personalizzato, indipendentemente da come è stato addestrato - che sia stato costruito da zero, preso da open-source o perfezionato con dati proprietari. Registra semplicemente il tuo modello con MLflow, e noi prepareremo automaticamente un contenitore pronto per la produzione con librerie GPU come CUDA e lo distribuiremo su GPU serverless. Il nostro servizio completamente gestito si occuperà di tutto il lavoro pesante per te, eliminando la necessità di gestire istanze, mantenere la compatibilità delle versioni e applicare patch alle versioni. Il servizio scalerà automaticamente le istanze per soddisfare i modelli di traffico, risparmiando sui costi dell'infrastruttura e ottimizzando le prestazioni di latenza.