Retour aux cours
AI030 Professional

Fondamentaux de l'IA générative en Python

Un guide complet pour comprendre et mettre en œuvre l'IA générative et les grands modèles linguistiques (LLM). Ce cours couvre la transition des fondements théoriques au développement pratique en Python, incluant les GAN, les modèles de diffusion, les transformateurs, le fine-tuning et le déploiement en production.

4.8
21.0h
964 étudiants
5 j'aime
Intelligence Artificielle

Aperçu du cours

📚 Résumé du contenu

Un guide complet pour comprendre et mettre en œuvre l'IA générative et les grands modèles linguistiques (LLM). Ce cours couvre la transition des fondements théoriques vers un développement pratique basé sur Python, incluant les réseaux antagonistes génératifs (GAN), les modèles de diffusion, les Transformers, le fine-tuning et le déploiement en production.

Maîtrisez les principes fondamentaux et les applications pratiques des LLM modernes et des techniques génératives avec Python.

Auteur : Carlos Rodriguez

Remerciements : Remerciements spéciaux à la femme de l'auteur, Jill, à ses parents, ainsi qu'aux relecteurs techniques Morgan Boyce, Eric Rui et Samira Shaikh (auteure de la préface).

🎯 Objectifs d'apprentissage

  1. Différencier les paradigmes classiques (discriminatifs) de l'apprentissage machine et les modèles d'IA générative.
  2. Identifier les architectures fondamentales de l'IA générative, notamment les GAN, les modèles de diffusion et les Transformers.
  3. Expliquer le rôle et l'évolution des grands modèles linguistiques (LLM) dans le paysage plus large de l'intelligence artificielle.
  4. Différencier les caractéristiques uniques et les paradigmes architecturaux des GAN, des diffuseurs et des Transformers.
  5. Analyser les progrès et les limites de chaque type de modèle, y compris des problèmes spécifiques comme le « collapse de mode » ou la vitesse d'échantillonnage.
  6. Mettre en œuvre une chaîne de traitement Stable Diffusion et évaluer les sorties générées à l’aide de logits et de probabilités basés sur CLIP.
  7. Suivre l’évolution du traitement du langage naturel (NLP) depuis les méthodes basées sur des comptages initiales et les RNN jusqu’aux représentations distribuées modernes et l’apprentissage par transfert.
  8. Expliquer les mécanismes techniques du Multi-head Attention (MHA), de l’attention self-attention, du masquage et du réseau feed-forward (FFN).
  9. Implémenter une architecture complète de Transformer, incluant le tokenisation des données, le codage positionnel et les fonctions d’entraînement et d’inférence.
  10. Adapter les fonctionnalités de prototypage (ex. Google Colab) à des environnements prêts pour la production via Docker et VS Code.

🔹 Leçon 1 : Fondements et paradigmes de l'IA générative

Aperçu : Cette leçon établit le changement fondamental entre les paradigmes classiques d'apprentissage machine et l'ère de l'IA générative. Elle explore l'évolution architecturale — des GAN aux Transformers — et présente les grands modèles linguistiques (LLM) comme pilier de la compréhension synthétique et de la génération de contenu.

Objectifs d'apprentissage :

  • Différencier les paradigmes classiques (discriminatifs) de l'apprentissage machine et les modèles d'IA générative.
  • Identifier les architectures fondamentales de l'IA générative, notamment les GAN, les modèles de diffusion et les Transformers.
  • Expliquer le rôle et l'évolution des grands modèles linguistiques (LLM) dans le paysage plus large de l'intelligence artificielle.

🔹 Leçon 2 : Enquête architecturale : GAN, diffuseurs et Transformers

Aperçu : Cette leçon propose une enquête approfondie sur les trois piliers architecturaux principaux de l'IA générative : les réseaux antagonistes génératifs (GAN), les modèles de diffusion et les Transformers. Les étudiants exploreront la déconstruction technique de ces méthodes, leurs avancées évolutives, leurs limites inhérentes et leurs applications pratiques dans la génération d’images et l’évaluation à l’aide de métriques CLIP dans des environnements Jupyter/Colab.

Objectifs d'apprentissage :

  • Différencier les caractéristiques uniques et les paradigmes architecturaux des GAN, des diffuseurs et des Transformers.
  • Analyser les progrès et les limites de chaque type de modèle, y compris des problèmes spécifiques comme le « collapse de mode » ou la vitesse d’échantillonnage.
  • Mettre en œuvre une chaîne de traitement Stable Diffusion et évaluer les sorties générées à l’aide de logits et de probabilités basés sur CLIP.

🔹 Leçon 3 : Évolution du NLP et architecture du Transformer

Aperçu : Cette leçon suit la trajectoire historique du traitement du langage naturel, des premières méthodes statistiques jusqu’à l’architecture révolutionnaire du Transformer. Elle couvre la transition des modèles séquentiels basés sur les RNN vers des mécanismes d’attention auto-référente parallélisables, en détaillant les composants spécifiques du Transformer original (encodeur/décodageur) et l’implémentation pratique d’une chaîne de traduction en utilisant PyTorch.

Objectifs d'apprentissage :

  • Suivre l’évolution du NLP depuis les méthodes basées sur des comptages initiales et les RNN jusqu’aux représentations distribuées modernes et l’apprentissage par transfert.
  • Expliquer les mécanismes techniques du Multi-head Attention (MHA), de l’attention self-attention, du masquage et du réseau feed-forward (FFN).
  • Implémenter une architecture complète de Transformer, incluant le tokenisation des données, le codage positionnel et les fonctions d’entraînement et d’inférence.

🔹 Leçon 4 : Ingénierie en production et déploiement responsable de l'IA

Aperçu : Cette leçon traite de la transition cruciale entre le prototypage de l’apprentissage machine (phases expérimentales) et les déploiements stables et prêts à la production. Elle intègre les principes d’ingénierie en production — tels que la conteneurisation avec Docker et la cartographie d’environnement — aux impératifs éthiques de l’IA responsable, axés sur la mitigation des biais, la transparence et l’évaluation rigoureuse des modèles à l’aide de métriques comme les scores CLIP et la similarité lexicale.

Objectifs d'apprentissage :

  • Adapter les fonctionnalités de prototypage (ex. Google Colab) à des environnements prêts pour la production via Docker et VS Code.
  • Calculer la complexité computationnelle et les besoins en mémoire du modèle afin de déterminer les exigences matérielles spécialisées.
  • Évaluer les modèles génératifs à l’aide de métriques quantitatives (BLEU, ROUGE, METEOR) et d’alignement avec CLIP.

🔹 Leçon 5 : Techniques de fine-tuning et apprentissage efficace en paramètres

Aperçu : Cette leçon aborde la transition du réglage par prompt vers le fine-tuning spécifique à une tâche. Elle explore l’apprentissage en contexte (zero-shot et few-shot), la génération augmentée par récupération (RAG) et l’implémentation pratique du fine-tuning efficace en paramètres (PEFT) en Python. Les étudiants apprendront à construire une chaîne de réponse aux questions, à utiliser la classe Trainer de Hugging Face et à évaluer les résultats à l’aide de la perte d’entraînement et de la similarité sémantique.

Objectifs d'apprentissage :

  • Différencier l’apprentissage en contexte (zero/few-shot), RAG et le fine-tuning.
  • Mettre en œuvre un flux de fine-tuning basé sur PEFT en utilisant AdaLoRA et la classe Trainer de Hugging Face.
  • Calculer et interpréter les métriques de performance du modèle, y compris la perte d’entraînement et les scores de similarité sémantique.

🔹 Leçon 6 : Adaptation au domaine pour les grands modèles linguistiques spécialisés

Aperçu : Cette leçon explore la transformation des grands modèles linguistiques (LLM) des outils polyvalents vers des experts spécialisés dans le domaine financier. Les étudiants apprendront le contexte historique de l’adaptation au domaine, maîtriseront les méthodologies d’entraînement fondamentales telles que le modèle de langage causal (CLM) et la prédiction de la phrase suivante (NSP), et mèneront un projet pratique d’apprentissage par transfert utilisant le fine-tuning efficace en paramètres (PEFT). La session se conclut par des techniques d’évaluation rigoureuses à l’aide des métriques ROUGE et des scores classiques de classification (Précision, Rappel, F1).

Objectifs d'apprentissage :

  • Formuler l’histoire et l’importance critique de l’adaptation des LLM généraux à des domaines spécialisés.
  • Exécuter une chaîne complète d’apprentissage par transfert dans le domaine financier, incluant le prétraitement et le tokenisation.
  • Différencier les méthodologies d’entraînement CLM et NSP.

🔹 Leçon 7 : Ingénierie avancée de prompts et implémentation de récupération

Aperçu : Cette leçon explore l’évolution de l’interaction avec les grands modèles linguistiques (LLM), passant du fine-tuning traditionnel à des approches basées sur les prompts. Elle détaille l’utilisation stratégique de personnages, de jeux de rôle situationnels et l’implémentation de la génération augmentée par récupération (RAG) via LlamaIndex afin de produire des réponses contextuelles, sécurisées et conformes à la marque.

Objectifs d'apprentissage :

  • Formuler la transition du fine-tuning lourd en paramètres vers une inférence efficace basée sur les prompts.
  • Concevoir et implémenter des personnages et des jeux de rôle situationnels pour guider le comportement et la distribution de sortie du modèle.
  • Construire une chaîne fonctionnelle de RAG en utilisant Python et le cadre LlamaIndex.