EvoClass | Education That Evolves With You

📚 Résumé du contenu

Ce cours propose une introduction complète et approfondie à l'évolution des grands modèles linguistiques (LLM), à leurs architectures techniques fondamentales, aux paradigmes d'entraînement (pré-entraînement, fine-tuning et alignement), aux extensions multimodales, à l'ingénierie de prompts, au Chain of Thought (CoT), aux agents, ainsi qu'à des sujets de pointe tels que la sécurité des modèles et la protection de la vie privée.

Analyse approfondie de l'évolution technologique et de l'alignement en matière de sécurité des grands modèles intégraux, de la pré-entraînement aux agents généralistes.

🎯 Objectifs d'apprentissage

Différencier les architectures de modèles : identifier les différences structurelles et les cas d'utilisation des modèles Encoder-seul, Decoder-seul et Encoder-Decoder.
Expliquer le pipeline d'entraînement des LLM : décrire la transition du pré-entraînement auto-supervisé vers le Fine-Tuning supervisé (SFT) et l'Apprentissage par Renforcement à partir des retours humains (RLHF).
Analyser l'échelle des modèles et leur comportement : expliquer les concepts des Lois d'Échelle, des Capacités Émergentes (apprentissage in-context, Chain of Thought) et du phénomène des Hallucinations.
Analyser les différences structurelles entre les architectures Encoder-seul (BERT), Decoder-seul (GPT) et Encoder-Decoder (T5).
Expliquer le processus d'entraînement en trois étapes : Pré-entraînement (modèle de base), Tuning d'instructions (SFT) et Alignement (RLHF/PPO).
Comparer les performances, les lois d'échelle et les innovations architecturales des principaux LLM comme GPT, Llama, Qwen et DeepSeek.
Mettre en œuvre des stratégies de prompting zéro-shot et few-shot pour l'extraction et la classification de données structurées.
Calibrer les hyperparamètres du modèle (Température, Top P, Pénalités) afin d'équilibrer les sorties créatives et déterministes.
Construire des prompts efficaces de Chain-of-Thought (CoT) en utilisant des méthodes manuelles, automatiques et zéro-shot ("Pensons étape par étape").
Analyser et comparer les variantes de CoT : distinguer entre Self-Consistency, Program of Thought (PoT), Tree-of-Thought (ToT) et Graph-of-Thought (GoT).

Aperçu : Cette leçon explore l'équilibre critique entre l'utilité et la sécurité des grands modèles linguistiques (LLM), en se concentrant sur les mécanismes des attaques "jailbreak" et la mise en œuvre technique de la stéganographie. Elle couvre comment les attaquants contournent les filtres de sécurité grâce à une ingénierie de prompts sophistiquée (ex. DAN, STAN) et comment les LLM peuvent être utilisés pour une communication discrète en intégrant des données dans le processus de génération de tokens. En outre, elle présente l'architecture et les capacités des grands modèles linguistiques multimodaux (MLLM) pour traiter et générer divers types de données comme les images, audio et vidéos.

Résultats d'apprentissage :

Identifier et analyser les schémas courants d'attaques "jailbreak", incluant le rôle-joué (DAN), la coercition cognitive (PUA) et les méthodes de canal latéral (chiffre/code).
Expliquer le mécanisme technique de la stéganographie des LLM, spécifiquement comment les flux binaires sont cartographiés sur la distribution de probabilité (logits) des prédictions du prochain token.
Catégoriser les architectures MLLM selon leur capacité à percevoir et à générer à travers plusieurs modalités (Texte, Image, Audio, 3D).

Approfondissement sur les grands modèles de langage

Leçons

Lesson

Aperçu du cours

📚 Résumé du contenu

🎯 Objectifs d'apprentissage

Leçons