Python中的生成式AI基础
本课程全面讲解生成式人工智能和大语言模型(LLMs)的理解与实现。课程涵盖从理论基础到基于Python的实际开发的过渡,包括GAN、扩散模型、Transformer、微调以及生产环境部署。
课程概述
📚 内容概要
一本全面指南,帮助理解并实现生成式人工智能与大型语言模型(LLMs)。本课程涵盖从理论基础到基于 Python 的实际开发的转变,包括生成对抗网络(GANs)、扩散模型、Transformer 架构、微调以及生产环境部署。
掌握现代 LLM 与生成技术的核心原理和实际应用,使用 Python 进行实践。
作者: 卡洛斯·罗德里格斯
致谢: 特别感谢作者的妻子吉尔、他的父母,以及技术审稿人摩根·博伊斯、埃里克·鲁伊和萨米拉·沙伊赫(前言作者)。
🎯 学习目标
- 区分传统(判别式)机器学习范式与生成式 AI 模型。
- 识别生成式 AI 的基础架构,包括 GANs、扩散模型和 Transformer。
- 解释大型语言模型(LLMs)在更广泛人工智能领域中的角色与演变。
- 区分 GANs、扩散模型和 Transformer 的独特特征及架构范式。
- 分析每种模型类型的进展与局限性,包括模式崩溃或采样速度等具体问题。
- 实现一个 Stable Diffusion 流水线,并使用基于 CLIP 的逻辑值和概率评估生成输出。
- 追溯自然语言处理(NLP)从早期计数方法和循环神经网络(RNNs)到现代分布式表示与迁移学习的发展历程。
- 解释多头注意力(MHA)、自注意力、掩码机制以及前馈网络(FFN)的技术原理。
- 实现完整的 Transformer 模型架构,包括数据分词、位置编码,以及训练/推理函数。
- 将原型功能(如 Google Colab)映射到生产就绪环境,使用 Docker 与 VS Code。
🔹 第 1 课:生成式 AI 的基础与范式
概述: 本课建立从传统机器学习范式向生成式 AI 时代的根本转变。它探讨了从 GANs 到 Transformer 的架构演进,并引入大型语言模型(LLMs)作为合成理解与内容生成的核心。
学习成果:
- 区分传统(判别式)机器学习范式与生成式 AI 模型。
- 识别生成式 AI 的基础架构,包括 GANs、扩散模型和 Transformer。
- 解释大型语言模型(LLMs)在更广泛人工智能领域中的角色与演变。
🔹 第 2 课:架构综览:GANs、扩散模型与 Transformer
概述: 本课对生成式 AI 的三大核心架构支柱——生成对抗网络(GANs)、扩散模型和 Transformer——进行全面调查。学生将深入分析这些方法的技术解构、演化进展、内在局限性,以及在图像生成与评估中使用 CLIP 指标在 Jupyter/Colab 环境中的实际应用。
学习成果:
- 区分 GANs、扩散模型和 Transformer 的独特特征与架构范式。
- 分析每种模型类型的进展与局限性,包括模式崩溃或采样速度等具体问题。
- 实现一个 Stable Diffusion 流水线,并使用基于 CLIP 的逻辑值和概率评估生成输出。
🔹 第 3 课:自然语言处理的演进与 Transformer 架构
概述: 本课追溯自然语言处理(NLP)的历史轨迹,从早期统计方法到革命性的 Transformer 架构。它涵盖从基于序列的 RNN 模型向可并行化的自注意力机制的转变,详细说明原始 Transformer(编码器/解码器)的具体组件,并实践使用 PyTorch 实现翻译流水线。
学习成果:
- 追溯自然语言处理(NLP)从早期计数方法和 RNNs 到现代分布式表示与迁移学习的发展历程。
- 解释多头注意力(MHA)、自注意力、掩码机制以及前馈网络(FFN)的技术原理。
- 实现完整的 Transformer 模型架构,包括数据分词、位置编码,以及训练/推理函数。
🔹 第 4 课:生产工程与负责任的 AI 部署
概述: 本课涵盖从机器学习原型设计(实验阶段)到稳定、生产就绪部署的关键过渡。它融合了生产工程原则——如使用 Docker 容器化和环境映射——与负责任 AI 的伦理要求,重点关注偏差缓解、透明度,以及通过 CLIP 分数和词汇相似性等指标进行严格的模型基准测试。
学习成果:
- 将原型功能(如 Google Colab)映射到生产就绪环境,使用 Docker 与 VS Code。
- 计算模型的计算复杂度与内存需求,以确定专用硬件需求。
- 使用定量指标(如 BLEU、ROUGE、METEOR)评估生成模型,并与 CLIP 对齐。
🔹 第 5 课:微调技术与参数高效学习
概述: 本课探讨从基于提示的模型适配转向任务特定微调的转变。它研究上下文学习(零样本与少样本)、检索增强生成(RAG),以及使用 Python 实践参数高效微调(PEFT)的方法。学生将学习构建问答流水线,使用 Hugging Face Trainer 类,并通过训练损失和语义相似性评估结果。
学习成果:
- 区分上下文学习(零样本/少样本)、RAG 与微调之间的差异。
- 使用 AdaLoRA 和 Hugging Face
Trainer类实现基于 PEFT 的微调工作流。 - 计算并解读模型性能指标,包括训练损失和语义相似性得分。
🔹 第 6 课:面向专业领域的大型语言模型领域适应
概述: 本课探讨大型语言模型(LLMs)从通用工具向金融领域专业化专家的转型。学生将了解领域适应的历史背景,掌握核心训练方法,如因果语言建模(CLM)和下一句预测(NSP),并通过参数高效微调(PEFT)执行动手转移学习项目。本模块以使用 ROUGE 指标和传统分类评分(精确率、召回率、F1)进行严格评估技巧收尾。
学习成果:
- 阐述将通用 LLM 适应到特定领域的历史背景与关键重要性。
- 执行完整的金融领域转移学习流水线,包括预处理与分词。
- 区分 CLM 与 NSP 训练方法。
🔹 第 7 课:高级提示工程与检索实现
概述: 本课探索大型语言模型(LLM)交互方式的演进,从传统的微调转向基于提示的方法。它详述角色设定、情境角色扮演的战略运用,以及使用 LlamaIndex 实现检索增强生成(RAG),以创建上下文感知、安全且品牌一致的 AI 回应。
学习成果:
- 阐述从高参数量微调向高效提示推理的转变。
- 设计并实现角色设定与情境角色扮演,以引导模型行为与输出分布。
- 使用 Python 与 LlamaIndex 框架构建功能完整的 RAG 流水线。