Mosaic AI Agent Framework
Build production-quality retrieval augmented generation (RAG) apps
![](/en-website-assets/static/345dd9528d5493bd2ec72d1c15cdab0a/rag-header-img1717673084.png)
La Retrieval augmented generation (Generazione potenziata dal recupero, RAG) è un modello applicativo di AI generativa che trova dati e/o documenti rilevanti per una domanda o un compito e li fornisce come contesto al modello linguistico di grandi dimensioni (LLM), così che questo possa restituire risposte più accurate.
Databricks dispone di una suite di strumenti RAG che consente di combinare e ottimizzare tutti gli aspetti del processo RAG, come la preparazione dei dati, i modelli di reperimento, i modelli linguistici (SaaS o open-source), le pipeline di classificazione e post-elaborazione, il prompt engineering e l'addestramento dei modelli basati su dati aziendali personalizzati.
![Retrieval Augmented Generation](/en-website-assets/static/ca3eb4b38c0cf5dfe30f9b042bf7ab6d/rag-image-021705305921.png)
Accesso a modelli SaaS proprietari e open source
Con Databricks puoi implementare, monitorare, gestire e interrogare qualsiasi modello di AI generativa. Tutti i modelli più diffusi, come LangChain, Llama 2, MPT e BGE, e i modelli su Azure OpenAI, Amazon Bedrock, Amazon SageMaker e Anthropic possono essere gestiti e governati in Model Serving, rendendo più facile la valutazione e creazione di modelli per trovare quello ideale per la tua applicazione RAG.
![Retrieval Augmented Generation](/en-website-assets/static/141bbf7cd936415424b43a5285dcb0b1/rag-image-031705307142.png)
Pipeline automatizzata in tempo reale per qualsiasi tipo di dati
Databricks supporta nativamente il servizio e l'indicizzazione dei dati per il recupero online. Nel caso di dati non strutturati (testo, immagini e video), Vector Search indicizza e serve automaticamente i dati, rendendoli accessibili alle applicazioni RAG senza dover creare pipeline di dati separate. Dietro le quinte, Vector Search gestisce errori e nuovi tentativi e ottimizza le dimensioni dei batch per offrirti il meglio in termini di prestazioni, produttività e costi. Per i dati strutturati, Feature and Function Serving fornisce con tempi di risposta nell'ordine dei millisecondi query quei dati contestuali, ad esempio dati dell'utente o dell'account, che le aziende spesso vogliono inserire nei prompt per personalizzarli in base alle informazioni dell'utente.
![Retrieval Augmented Generation](/en-website-assets/static/75fadadcfa93e37acfe3395e5969c642/rag-image-041705307730.png)
Rendi velocemente operative le applicazioni RAG
Databricks semplifica l'implementazione, la gestione, l'interrogazione e il monitoraggio di modelli linguistici di grandi dimensioni, messi a punto o preinstallati da Databricks o da qualsiasi altro fornitore di modelli. Databricks Model Serving si occuperà della creazione automatizzata di contenitori e della gestione dell'infrastruttura per ridurre i costi di manutenzione e accelerare la distribuzione.
![Retrieval Augmented Generation](/en-website-assets/static/18dda9eed580b703faf7a4f8226524e4/rag-image-051705308041.png)
Governance integrata
Databricks integra funzionalità di sicurezza, governance e monitoraggio. Le applicazioni RAG garantiscono un controllo granulare degli accessi a dati e modelli. Puoi impostare limiti di query e tracciare la derivazione in tutti i modelli. Ciò garantisce che l'applicazione RAG non mostri dati riservati a utenti che non autorizzati.