EvoClass | Education That Evolves With You

📚 内容概要

本课程全面深入地介绍了大语言模型（LLMs）的演进历程、核心技术架构、训练范式（预训练、微调与对齐）、多模态扩展、提示工程、思维链（CoT）、智能体，以及模型安全与隐私保护等前沿议题。

从预训练到通用智能体，深度剖析全栈大模型的技术演进与安全对齐。

🎯 学习目标

区分模型架构：识别仅编码器（Encoder-only）、仅解码器（Decoder-only）和编码器-解码器（Encoder-Decoder）模型在结构上的差异及其应用场景。
解释大语言模型训练流程：描述从自监督预训练到有监督微调（SFT）及基于人类反馈的强化学习（RLHF）的转变过程。
分析模型缩放与行为：解释缩放定律、涌现能力（上下文学习、思维链）以及幻觉现象的概念。
分析仅编码器（BERT）、仅解码器（GPT）和编码器-解码器（T5）架构之间的结构差异。
解释三阶段训练过程：预训练（基础模型）、指令微调（SFT）与对齐（RLHF/PPO）。
比较主流大语言模型（如 GPT、Llama、Qwen、DeepSeek）在性能、缩放定律和架构创新方面的表现。
实现零样本与少样本提示策略，用于结构化数据提取与分类任务。
调整模型超参数（温度、Top P、惩罚项），以平衡创造性输出与确定性输出。
使用手动、自动以及零样本（“让我们一步步思考”）方法构建有效的思维链（CoT）提示。
分析并比较不同思维链变体：区分自一致性（Self-Consistency）、思维程序（PoT）、思维树（ToT）与思维图（GoT）架构。

概述： 本课聚焦大语言模型（LLM）实用性与安全性之间的关键平衡，重点分析“越狱”攻击的机理与隐写术的技术实现。内容涵盖攻击者如何利用复杂的提示工程技术（如 DAN、STAN）绕过安全过滤，以及如何通过在令牌生成过程中嵌入数据实现隐蔽通信。此外，还将介绍多模态大语言模型（MLLMs）的架构与能力，涵盖图像、音频与视频等多样化数据类型的处理与生成。

学习成果：

识别并分析常见的越狱攻击模式，包括角色扮演（DAN）、认知胁迫（PUA）与侧信道方法（密码/代码）。
解释大语言模型隐写术的技术机制，特别是比特流如何映射至下一个词预测的概率分布（logits）。
根据跨模态感知与生成能力，对多模态大语言模型（MLLM）架构进行分类（文本、图像、音频、3D）。

深入探究大型语言模型

课程

Lesson

课程概述

📚 内容概要

🎯 学习目标

课程