EvoClass | Education That Evolves With You

📚 Résumé du contenu

Ce cours propose une introduction complète et approfondie à l'évolution des grands modèles linguistiques (LLM), à leurs architectures techniques fondamentales, aux paradigmes d'entraînement (pré-entraînement, fine-tuning et alignement), aux extensions multimodales, à l'ingénierie de prompts, au Chain of Thought (CoT), aux agents, ainsi qu'à des sujets de pointe tels que la sécurité des modèles et la protection de la vie privée.

Analyse approfondie de l'évolution technologique et de l'alignement en matière de sécurité des grands modèles intégraux, de la pré-entraînement aux agents généralistes.

🎯 Objectifs d'apprentissage

Différencier les architectures de modèles : identifier les différences structurelles et les cas d'utilisation des modèles Encoder-seul, Decoder-seul et Encoder-Decoder.
Expliquer le pipeline d'entraînement des LLM : décrire la transition du pré-entraînement auto-supervisé vers le Fine-Tuning supervisé (SFT) et l'Apprentissage par Renforcement à partir des retours humains (RLHF).
Analyser l'échelle des modèles et leur comportement : expliquer les concepts des Lois d'Échelle, des Capacités Émergentes (apprentissage in-context, Chain of Thought) et du phénomène des Hallucinations.
Analyser les différences structurelles entre les architectures Encoder-seul (BERT), Decoder-seul (GPT) et Encoder-Decoder (T5).
Expliquer le processus d'entraînement en trois étapes : Pré-entraînement (modèle de base), Tuning d'instructions (SFT) et Alignement (RLHF/PPO).
Comparer les performances, les lois d'échelle et les innovations architecturales des principaux LLM comme GPT, Llama, Qwen et DeepSeek.
Mettre en œuvre des stratégies de prompting zéro-shot et few-shot pour l'extraction et la classification de données structurées.
Calibrer les hyperparamètres du modèle (Température, Top P, Pénalités) afin d'équilibrer les sorties créatives et déterministes.
Construire des prompts efficaces de Chain-of-Thought (CoT) en utilisant des méthodes manuelles, automatiques et zéro-shot ("Pensons étape par étape").
Analyser et comparer les variantes de CoT : distinguer entre Self-Consistency, Program of Thought (PoT), Tree-of-Thought (ToT) et Graph-of-Thought (GoT).

🔹 Leçon 1 : Introduction aux grands modèles linguistiques et aux technologies de pré-entraînement

Aperçu : Cette leçon explore l'évolution de l'intelligence artificielle, passant des petits modèles spécialisés aux grands modèles linguistiques (LLM) polyvalents. Elle détaille le changement architectural allant des modèles basés sur Encoder « BERTology » vers les paradigmes génératifs à base de Decoder, en couvrant le pipeline technique essentiel du pré-entraînement, du tuning d'instructions et de l'alignement (RLHF). En outre, le contenu examine les familles de modèles leaders du secteur, notamment GPT, Llama, ainsi que des innovations nationales comme Qwen et DeepSeek.