AI025 Professional

Systèmes RAG pratiques : des bases de connaissances à la génération augmentée par recherche

Ces notes de cours offrent une perspective système pour la construction de systèmes utilisables de génération augmentée par recherche (RAG). Le cours couvre l'ensemble du processus, y compris l'ingestion des données, les stratégies de découpage, le mapping des embeddings, le stockage vectoriel, la récupération hybride, le reranking et l'évaluation pour des applications d'IA fiables.

5.0

15.0h

619 étudiants

0 j'aime

Intelligence Artificielle

Commencer à apprendre

Leçons

Lesson

1 Lesson 1

This lesson introduces Retrieval-Augmented Generation (RAG) as a solution to the limitations of static, "closed-book" LLMs by grounding model responses in dynamic, external knowledge bases. Students will learn to identify the core components of the RAG lifecycle and understand how to design effective document ingestion and retrieval pipelines to ensure factual reliability and traceability.

2 Lesson 2

This lesson explores the strategic importance of data transformation in RAG systems, focusing on how chunking strategies, embedding models, and indexing algorithms impact retrieval performance. Students will learn to balance the precision-recall paradox by defining optimal retrieval units that maintain semantic coherence while managing latency and token constraints.

3 Lesson 3

This lesson explores advanced retrieval optimization by contrasting the semantic strengths of dense vector search with the precision of lexical BM25 retrieval. Students will learn to implement hybrid search architectures, including Reciprocal Rank Fusion (RRF) and Cross-Encoder reranking, to effectively balance semantic intent with exact keyword matching in production RAG systems.

4 Lesson 4

This lesson explores the "Demo Paradox" in Retrieval-Augmented Generation, emphasizing that system reliability depends on integrated pipelines rather than isolated metrics. Students will learn how to ensure trustworthiness through metadata persistence, traceability, and rigorous observability across all stages of the RAG architecture.

5 Lesson 5

This lesson explores the transition from RAG prototypes to production-ready systems by emphasizing architectural reliability, statistical verification, and the importance of handling real-world data entropy. Students will learn to implement observability through full-trace telemetry and design robust pipelines that prioritize system stability and predictable, evidence-based outputs over anecdotal success.

Aperçu du cours

📚 Résumé du contenu

Ces notes de cours étudiantes offrent une vision système pour concevoir des systèmes de génération augmentée par la récupération (RAG) utilisables. Le cours couvre l'intégralité du pipeline, incluant l'ingestion des données, les stratégies de découpage, le mapping des embeddings, le stockage vectoriel, la récupération hybride, le reranking et l'évaluation pour des applications d'IA fiables.

Maîtrisez l'art de construire des systèmes d'IA fondés sur des preuves grâce à une approche complète du pipeline RAG.

Auteur : EvoClass

Remerciements : Équipe EvoClass

🎯 Objectifs d'apprentissage