Sistemi RAG Pratici: Dalle basi di conoscenza alla Generazione con Recupero
Queste note di lezione degli studenti offrono una visione a livello di sistema per la creazione di sistemi RAG (Retrieval-Augmented Generation) utilizzabili. Il corso copre l'intero processo, compresi l'ingestione dei dati, le strategie di suddivisione in frammenti, la mappatura degli embedding, lo stoccaggio vettoriale, il recupero ibrido, il riordinamento e la valutazione per applicazioni affidabili di intelligenza artificiale.
Lezioni
Panoramica del corso
📚 Riepilogo del Contenuto
Queste note di lezione degli studenti offrono una visione a livello di sistema per la costruzione di sistemi RAG (Retrieval-Augmented Generation) utilizzabili. Il corso copre l'intero flusso, compresa l'ingestione dei dati, le strategie di chunking, la mappatura degli embedding, lo storage vettoriale, la ricerca ibrida, il reranking e la valutazione per applicazioni affidabili di intelligenza artificiale.
Padroneggia l'arte della creazione di sistemi AI basati su prove attraverso un approccio completo al flusso RAG.
Autore: EvoClass
Ringraziamenti: Team EvoClass
🎯 Obiettivi di Apprendimento
- Distinguere tra prompting, fine-tuning e RAG per scegliere lo strumento corretto in base a esigenze aziendali specifiche.
- Mappare il flusso delle informazioni all'interno di un flusso RAG, dal query dell'utente alla generazione basata su prove.
- Progettare un flusso di ingestione dati professionale che includa metadati, normalizzazione e versioning per prevenire errori derivanti da "dati deboli".
- Valutare e implementare diverse strategie di chunking (lunghezza fissa, consapevole della struttura, gerarchica) in base ai requisiti specifici del dominio.
- Spiegare i meccanismi degli embedding e la differenza tra similarità semantica e utilità della risposta.
- Descrivere la teoria tecnica dei magazzini vettoriali e dell'indicizzazione, concentrandosi sui compromessi tra velocità di recupero (latenza) e accuratezza.
- Progettare un piano di recupero a più fasi per un corpus su larga scala (100.000+ chunk), includendo strategie di metadati e filtraggio.
- Distinguere tra gli obiettivi del recupero (ricerca completa) e del reranking (precisione/rilevanza).
- Analizzare perché il reranking è essenziale per una generazione efficace dell'LLM e come interagisce con la progettazione dei chunk.
- Progettare strutture di metadati a monte che supportino il riconoscimento automatico delle citazioni e il recupero consapevole delle versioni.
🔹 Lezione 1: Fondamenti del RAG e Costruzione della Base di Conoscenza
Panoramica: Questa lezione stabilisce il passaggio dai modelli linguistici grandi (LLM) come motori di generazione isolati a sistemi fondati su conoscenza esterna. Gli studenti impareranno il flusso architetturale del Retrieval-Augmented Generation (RAG), capiranno perché la governance dei dati è la colonna portante della qualità del modello e scopriranno come progettare un processo di ingestione che garantisca affidabilità fattuale tramite metadati e versioning.
Risultati dell'Apprendimento:
- Distinguere tra prompting, fine-tuning e RAG per scegliere lo strumento corretto in base a esigenze aziendali specifiche.
- Mappare il flusso delle informazioni all'interno di un flusso RAG, dal query dell'utente alla generazione basata su prove.
- Progettare un flusso di ingestione dati professionale che includa metadati, normalizzazione e versioning per prevenire errori derivanti da "dati deboli".
🔹 Lezione 2: Trasformazione dei Dati: Chunking, Embeddings e Indicizzazione
Panoramica: Questa lezione esplora la transizione critica dai testi grezzi alle strutture dati ricercabili all'interno di un flusso RAG. Copre la selezione strategica delle "unità di recupero" attraverso diverse metodologie di chunking, la rappresentazione matematica del significato tramite embeddings e l'infrastruttura tecnica necessaria per rendere la ricerca in alta dimensione performante su larga scala.
Risultati dell'Apprendimento:
- Valutare e implementare diverse strategie di chunking (lunghezza fissa, consapevole della struttura, gerarchica) in base ai requisiti specifici del dominio.
- Spiegare i meccanismi degli embedding e la differenza tra similarità semantica e utilità della risposta.
- Descrivere la teoria tecnica dei magazzini vettoriali e dell'indicizzazione, concentrandosi sui compromessi tra velocità di recupero (latenza) e accuratezza.
🔹 Lezione 3: Ottimizzazione Avanzata del Recupero: Ricerca Ibrida e Reranking
Panoramica: Questa lezione affronta il passaggio dalla ricerca vettoriale di base a architetture di recupero adatte alla produzione. Si concentra sulla Ricerca Ibrida — la combinazione di recupero lessicale e semantico — e sul Flusso di Recupero a Due Fasi, in cui vengono utilizzati reranker per garantire che le evidenze più "ricche di risposta" raggiungano l'LLM. Gli studenti apprenderanno come progettare piani di recupero per corpora su larga scala e comprendere l'interazione critica tra qualità del ranking e accuratezza della generazione.
Risultati dell'Apprendimento:
- Progettare un piano di recupero a più fasi per un corpus su larga scala (100.000+ chunk), includendo strategie di metadati e filtraggio.
- Distinguere tra gli obiettivi del recupero (ricerca completa) e del reranking (precisione/rilevanza).
- Analizzare perché il reranking è essenziale per una generazione efficace dell'LLM e come interagisce con la progettazione dei chunk.
🔹 Lezione 4: Affidabilità e Qualità: Citazioni, Aggiornamento e Valutazione
Panoramica: Questa lezione si focalizza sul passaggio da prototipi "plausibili" a applicazioni RAG affidabili e pronte per la produzione. Esamina come la progettazione dei metadati permetta citazioni affidabili e accuratezza temporale (aggiornamento), e fornisce un framework a più livelli per valutare sia il recupero che la generazione, superando così dimostrazioni ingannevoli.
Risultati dell'Apprendimento:
- Progettare strutture di metadati a monte che supportino il riconoscimento automatico delle citazioni e il recupero consapevole delle versioni.
- Implementare strategie di aggiornamento che bilancino la recentezza del documento con il suo status autorevole.
- Creare set di benchmark completi e svolgere analisi di errore diagnostica per individuare fallimenti specifici nel flusso.
🔹 Lezione 5: Dal Prototipo alla Produzione: Integrazione e Sintesi del Flusso
Panoramica: Questa lezione passa dalle componenti teoriche del RAG alle realtà pratiche della costruzione di applicazioni pronte per la produzione. Si concentra sull'integrazione delle singole fasi in un'architettura coerente end-to-end, dove il successo è definito da osservabilità, gestione efficace degli errori e gestione attenta dei compromessi intrinseci del sistema. Gli studenti impareranno che un sistema utilizzabile è uno che privilegia la tracciabilità delle prove e il comportamento gradevole piuttosto che la complessità.
Risultati dell'Apprendimento:
- Mappare un'architettura pratica a 9 fasi per sistemi RAG.
- Identificare e valutare i compromessi critici tra prestazioni, accuratezza e costo.
- Diagnosare i fallimenti del flusso rintracciando gli errori fino alle fasi architetturali specifiche.