返回課程
AI012 Professional

深入探討大型語言模型

本課程提供大型語言模型(LLM)的發展歷程、核心技術架構、訓練模式(預訓練、微調與對齊)、多模態擴展、提示工程、思維鏈推理、智能代理,以及模型安全與隱私保護等前沿主題的全面深入介紹。

4.9
24.0h
1067 學習者
0 讚好
人工智能
開始學習

課程總覽

📚 內容摘要

本課程提供大型語言模型(LLM)演進、核心技術架構、訓練模式(預訓練、微調與對齊)、多模態擴展、提示工程、思考鏈(CoT)、代理系統,以及模型安全與隱私保護等前沿議題的全面且深入的介紹。

對全棧大型模型從預訓練到通用代理之技術演進與安全對齊的深度分析。

🎯 學習目標

  1. 辨別模型架構差異:識別僅編碼器(Encoder-only)、僅解碼器(Decoder-only)與編碼器-解碼器(Encoder-Decoder)模型的結構差異及其應用場景。
  2. 解釋 LLM 訓練流程:描述從自監督預訓練過渡到監督式微調(SFT)與人類反饋強化學習(RLHF)的轉變過程。
  3. 分析模型規模與行為:解釋規模法則(Scaling Laws)、突現能力(上下文學習、思考鏈)以及幻覺現象。
  4. 分析僅編碼器(BERT)、僅解碼器(GPT)與編碼器-解碼器(T5)架構之間的結構差異。
  5. 解釋三階段訓練流程:預訓練(基礎模型)、指令微調(SFT)與對齊(RLHF/PPO)。
  6. 比較主流 LLM(如 GPT、Llama、Qwen 與 DeepSeek)在性能、規模法則與架構創新方面的表現。
  7. 實施零樣本與少樣本提示策略,用於結構化資料提取與分類。
  8. 調校模型超參數(溫度、Top P、懲罰項),以平衡創造性與確定性輸出。
  9. 使用手動、自動與零樣本(「讓我們一步步思考」)方法,設計有效的思考鏈(CoT)提示。
  10. 分析並比較 CoT 變體:區分自我一致性、思考程式(PoT)、思維樹(ToT)與思維圖(GoT)架構。

課程