返回课程
AI012 Professional

深入探究大型语言模型

本课程全面深入地介绍了大型语言模型(LLMs)的发展历程、核心技术架构、训练范式(预训练、微调和对齐)、多模态扩展、提示工程、思维链推理、智能体,以及模型安全与隐私保护等前沿话题。

4.9
24.0h
1067 名学生
0 点赞
人工智能
开始学习

课程概述

📚 内容概要

本课程全面深入地介绍了大语言模型(LLMs)的演进历程、核心技术架构、训练范式(预训练、微调与对齐)、多模态扩展、提示工程、思维链(CoT)、智能体,以及模型安全与隐私保护等前沿议题。

从预训练到通用智能体,深度剖析全栈大模型的技术演进与安全对齐。

🎯 学习目标

  1. 区分模型架构:识别仅编码器(Encoder-only)、仅解码器(Decoder-only)和编码器-解码器(Encoder-Decoder)模型在结构上的差异及其应用场景。
  2. 解释大语言模型训练流程:描述从自监督预训练到有监督微调(SFT)及基于人类反馈的强化学习(RLHF)的转变过程。
  3. 分析模型缩放与行为:解释缩放定律、涌现能力(上下文学习、思维链)以及幻觉现象的概念。
  4. 分析仅编码器(BERT)、仅解码器(GPT)和编码器-解码器(T5)架构之间的结构差异。
  5. 解释三阶段训练过程:预训练(基础模型)、指令微调(SFT)与对齐(RLHF/PPO)。
  6. 比较主流大语言模型(如 GPT、Llama、Qwen、DeepSeek)在性能、缩放定律和架构创新方面的表现。
  7. 实现零样本与少样本提示策略,用于结构化数据提取与分类任务。
  8. 调整模型超参数(温度、Top P、惩罚项),以平衡创造性输出与确定性输出。
  9. 使用手动、自动以及零样本(“让我们一步步思考”)方法构建有效的思维链(CoT)提示。
  10. 分析并比较不同思维链变体:区分自一致性(Self-Consistency)、思维程序(PoT)、思维树(ToT)与思维图(GoT)架构。

课程