Retour aux cours
AI025 Professional

Systèmes RAG pratiques : des bases de connaissances à la génération augmentée par recherche

Ces notes de cours offrent une perspective système pour la construction de systèmes utilisables de génération augmentée par recherche (RAG). Le cours couvre l'ensemble du processus, y compris l'ingestion des données, les stratégies de découpage, le mapping des embeddings, le stockage vectoriel, la récupération hybride, le reranking et l'évaluation pour des applications d'IA fiables.

5.0
15.0h
619 étudiants
0 j'aime
Intelligence Artificielle
Commencer à apprendre

Aperçu du cours

📚 Résumé du contenu

Ces notes de cours étudiantes offrent une vision système pour concevoir des systèmes de génération augmentée par la récupération (RAG) utilisables. Le cours couvre l'intégralité du pipeline, incluant l'ingestion des données, les stratégies de découpage, le mapping des embeddings, le stockage vectoriel, la récupération hybride, le reranking et l'évaluation pour des applications d'IA fiables.

Maîtrisez l'art de construire des systèmes d'IA fondés sur des preuves grâce à une approche complète du pipeline RAG.

Auteur : EvoClass

Remerciements : Équipe EvoClass

🎯 Objectifs d'apprentissage

  1. Différencier les approches par prompting, fine-tuning et RAG afin de choisir l'outil adapté aux besoins spécifiques des entreprises.
  2. Cartographier le flux d'information dans un pipeline RAG, du query utilisateur à la génération fondée sur des preuves.
  3. Concevoir un pipeline professionnel d'ingestion des données intégrant des métadonnées, une normalisation et une versionnage afin d'éviter les échecs liés aux "mauvaises données".
  4. Évaluer et implémenter diverses stratégies de découpage (longueur fixe, sensibilité structurelle, hiérarchique) selon les exigences spécifiques du domaine.
  5. Expliquer les mécanismes des embeddings et la distinction entre similarité sémantique et utilité des réponses.
  6. Décrire la théorie technique des magasins vectoriels et de l'indexation, en mettant l'accent sur les compromis entre vitesse de récupération (latence) et précision.
  7. Concevoir un plan de récupération en plusieurs étapes pour un corpus à grande échelle (100 000+ segments), incluant des stratégies de métadonnées et de filtrage.
  8. Différencier les objectifs de la récupération (couverture) et du reranking (précision/relevance).
  9. Analyser pourquoi le reranking est essentiel pour une génération efficace des LLM et comment il interagit avec la conception des segments.
  10. Concevoir des structures de métadonnées amont qui soutiennent la citation automatisée et la récupération sensible à la version.

🔹 Leçon 1 : Fondements du RAG et construction de bases de connaissances

Aperçu : Cette leçon établit la transition des modèles linguistiques massifs (LLM) considérés comme des moteurs de génération isolés vers des systèmes ancrés utilisant des connaissances externes. Les étudiants apprendront le pipeline architectural de la Génération augmentée par la récupération (RAG), comprendront pourquoi la gouvernance des données est le pilier de la qualité des modèles, et découvriront comment concevoir un processus d'ingestion assurant la fiabilité factuelle grâce aux métadonnées et au versionnage.

Objectifs d'apprentissage :

  • Différencier les approches par prompting, fine-tuning et RAG afin de choisir l'outil adapté aux besoins spécifiques des entreprises.
  • Cartographier le flux d'information dans un pipeline RAG, du query utilisateur à la génération fondée sur des preuves.
  • Concevoir un pipeline professionnel d'ingestion des données intégrant des métadonnées, une normalisation et un versionnage afin d'éviter les échecs liés aux "mauvaises données".

🔹 Leçon 2 : Transformation des données : découpage, embeddings et indexation

Aperçu : Cette leçon explore la transition critique du texte brut vers des structures de données recherchables dans un pipeline RAG. Elle couvre le choix stratégique des « unités de récupération » via diverses méthodes de découpage, la représentation mathématique du sens à travers les embeddings, et l'infrastructure technique nécessaire pour rendre la recherche à haute dimension performante à grande échelle.

Objectifs d'apprentissage :

  • Évaluer et implémenter diverses stratégies de découpage (longueur fixe, sensibilité structurelle, hiérarchique) selon les exigences spécifiques du domaine.
  • Expliquer les mécanismes des embeddings et la distinction entre similarité sémantique et utilité des réponses.
  • Décrire la théorie technique des magasins vectoriels et de l'indexation, en mettant l'accent sur les compromis entre vitesse de récupération (latence) et précision.

🔹 Leçon 3 : Optimisation avancée de la récupération : recherche hybride et reranking

Aperçu : Cette leçon aborde la transition de la recherche vectorielle basique vers des architectures de récupération de production. Elle se concentre sur la Recherche Hybride — combinaison de récupération lexicale et sémantique — et sur le Pipeline de Récupération en Deux Étapes, où des rerankers sont utilisés pour garantir que les preuves les plus pertinentes atteignent le LLM. Les étudiants apprendront à concevoir des plans de récupération pour des corpora à grande échelle et à comprendre l'interaction critique entre la qualité du classement et la précision de la génération.

Objectifs d'apprentissage :

  • Concevoir un plan de récupération en plusieurs étapes pour un corpus à grande échelle (100 000+ segments), incluant des stratégies de métadonnées et de filtrage.
  • Différencier les objectifs de la récupération (couverture) et du reranking (précision/relevance).
  • Analyser pourquoi le reranking est essentiel pour une génération efficace des LLM et comment il interagit avec la conception des segments.

🔹 Leçon 4 : Fiabilité et qualité : citations, actualité et évaluation

Aperçu : Cette leçon se concentre sur la transition des prototypes "plausibles" vers des applications RAG fiables et prêtes à la production. Elle explore comment la conception des métadonnées permet des citations fiables et une exactitude temporelle (actualité), et fournit un cadre multicouche pour évaluer à la fois les phases de récupération et de génération, afin de dépasser les démonstrations trompeuses.

Objectifs d'apprentissage :

  • Concevoir des structures de métadonnées amont qui soutiennent la citation automatisée et la récupération sensible à la version.
  • Mettre en œuvre des stratégies d'actualité équilibrant la récence des documents et leur statut d'autorité.
  • Créer des jeux d'évaluation complets et effectuer une analyse diagnostique des erreurs pour identifier des échecs spécifiques dans le pipeline.

🔹 Leçon 5 : Du prototype à la production : intégration et synthèse du pipeline

Aperçu : Cette leçon passe des composants théoriques du RAG aux réalités pratiques de la construction d'applications prêtes à la production. Elle se concentre sur l'intégration des différentes étapes dans une architecture cohérente en bout à bout, où le succès est défini par l'observabilité, la gestion efficace des défaillances et la gestion prudente des compromis inhérents du système. Les étudiants apprendront qu'un système utilisable est celui qui privilégie la traçabilité des preuves et un comportement élégant plutôt que la complexité.

Objectifs d'apprentissage :

  • Cartographier une architecture pratique en 9 étapes pour les systèmes RAG.
  • Identifier et évaluer les compromis critiques entre performance, précision et coût.
  • Diagnostiquer les défaillances du pipeline en remontant les erreurs à des étapes architecturales spécifiques.