EvoClass | Education That Evolves With You

📚 內容摘要

本課程提供大型語言模型（LLM）演進、核心技術架構、訓練模式（預訓練、微調與對齊）、多模態擴展、提示工程、思考鏈（CoT）、代理系統，以及模型安全與隱私保護等前沿議題的全面且深入的介紹。

對全棧大型模型從預訓練到通用代理之技術演進與安全對齊的深度分析。

🎯 學習目標

辨別模型架構差異：識別僅編碼器（Encoder-only）、僅解碼器（Decoder-only）與編碼器-解碼器（Encoder-Decoder）模型的結構差異及其應用場景。
解釋 LLM 訓練流程：描述從自監督預訓練過渡到監督式微調（SFT）與人類反饋強化學習（RLHF）的轉變過程。
分析模型規模與行為：解釋規模法則（Scaling Laws）、突現能力（上下文學習、思考鏈）以及幻覺現象。
分析僅編碼器（BERT）、僅解碼器（GPT）與編碼器-解碼器（T5）架構之間的結構差異。
解釋三階段訓練流程：預訓練（基礎模型）、指令微調（SFT）與對齊（RLHF/PPO）。
比較主流 LLM（如 GPT、Llama、Qwen 與 DeepSeek）在性能、規模法則與架構創新方面的表現。
實施零樣本與少樣本提示策略，用於結構化資料提取與分類。
調校模型超參數（溫度、Top P、懲罰項），以平衡創造性與確定性輸出。
使用手動、自動與零樣本（「讓我們一步步思考」）方法，設計有效的思考鏈（CoT）提示。
分析並比較 CoT 變體：區分自我一致性、思考程式（PoT）、思維樹（ToT）與思維圖（GoT）架構。

概述： 本課探討大型語言模型（LLM）效能與安全性之間的關鍵平衡，聚焦於「越獄」攻擊的機制與隱寫術的技術實現。內容涵蓋攻擊者如何透過高階提示工程（如 DAN、STAN）繞過安全過濾，以及如何利用 LLM 在令牌生成過程中嵌入資料，達成隱蔽通訊。此外，還介紹多模態大型語言模型（MLLM）的架構與能力，使其能處理與生成影像、音訊與影片等多元資料類型。

學習成果：

識別並分析常見的越獄攻擊模式，包括角色扮演（DAN）、認知壓力（PUA）與側通道方法（密碼/代碼）。
解釋 LLM 隱寫術的技術機制，特別是位流如何映射至下一詞元預測的概率分佈（logits）。
根據跨多種模態（文字、影像、音訊、3D）的感知與生成能力，分類 MLLM 架構。

深入探討大型語言模型

課程

Lesson

課程總覽

📚 內容摘要

🎯 學習目標

課程