EvoClass | Education That Evolves With You

📚 Tóm tắt nội dung

Khóa học này cung cấp một giới thiệu toàn diện và sâu sắc về quá trình phát triển của các Mô hình Ngôn ngữ Lớn (LLM), kiến trúc kỹ thuật cốt lõi, các phương pháp huấn luyện (tiền huấn luyện, tinh chỉnh, điều chỉnh phù hợp), mở rộng đa phương tiện, kỹ thuật lập trình lời nhắc (prompt engineering), Chuỗi Tư duy (CoT), các tác nhân (agents), cũng như những chủ đề tiên phong như an toàn mô hình và bảo vệ quyền riêng tư.

Phân tích sâu về sự tiến hóa công nghệ và việc điều chỉnh phù hợp về an toàn trong các mô hình lớn toàn bộ hệ thống, từ giai đoạn tiền huấn luyện đến các tác nhân tổng quát.

🎯 Mục tiêu học tập

Phân biệt các kiến trúc mô hình: Nhận diện sự khác biệt về cấu trúc và các trường hợp sử dụng giữa các mô hình Encoder-only, Decoder-only và Encoder-Decoder.
Giải thích quy trình huấn luyện LLM: Mô tả quá trình chuyển đổi từ tiền huấn luyện tự giám sát sang Tinh chỉnh Có giám sát (SFT) và Học tăng cường từ Phản hồi Người dùng (RLHF).
Phân tích quy luật mở rộng và hành vi mô hình: Giải thích các khái niệm về Quy luật Mở rộng (Scaling Laws), Khả năng nổi bật (học trong ngữ cảnh, Chuỗi Tư duy), và hiện tượng Hư cấu (Hallucinations).
Phân tích sự khác biệt về cấu trúc giữa các kiến trúc Encoder-only (BERT), Decoder-only (GPT), và Encoder-Decoder (T5).
Giải thích quy trình huấn luyện ba giai đoạn: Tiền huấn luyện (mô hình cơ sở), Điều chỉnh Hướng dẫn (SFT), và Điều chỉnh Phù hợp (RLHF/PPO).
So sánh hiệu suất, quy luật mở rộng và các đổi mới kiến trúc của các LLM hàng đầu như GPT, Llama, Qwen và DeepSeek.
Triển khai chiến lược lập trình lời nhắc zero-shot và few-shot để trích xuất và phân loại dữ liệu có cấu trúc.
Điều chỉnh siêu tham số mô hình (Temperature, Top P, Penalty) để cân bằng giữa đầu ra sáng tạo và xác định.
Xây dựng các lời nhắc Chuỗi Tư duy (CoT) hiệu quả bằng các phương pháp thủ công, tự động và zero-shot ("Hãy suy nghĩ từng bước").
Phân tích và so sánh các biến thể CoT: Phân biệt giữa Tự nhất quán (Self-Consistency), Chương trình Tư duy (PoT), Cây Tư duy (ToT), và Đồ thị Tư duy (GoT).

Tổng quan: Bài học này khám phá quá trình phát triển của Trí tuệ nhân tạo từ các mô hình nhỏ chuyên biệt sang các Mô hình Ngôn ngữ Lớn (LLM) mang tính tổng quát. Nó chi tiết về sự dịch chuyển kiến trúc từ "BERTology" dựa trên Encoder sang các mô hình sinh tổng quát chỉ sử dụng Decoder, bao gồm quy trình kỹ thuật then chốt về tiền huấn luyện, điều chỉnh hướng dẫn và điều chỉnh phù hợp (RLHF). Ngoài ra, nội dung còn nghiên cứu các họ mô hình dẫn đầu ngành công nghiệp như GPT, Llama và các đổi mới trong nước như Qwen và DeepSeek.

Kết quả học tập:

Phân biệt các kiến trúc mô hình: Nhận diện sự khác biệt về cấu trúc và các trường hợp sử dụng giữa các mô hình Encoder-only, Decoder-only và Encoder-Decoder.
Giải thích quy trình huấn luyện LLM: Mô tả quá trình chuyển đổi từ tiền huấn luyện tự giám sát sang Tinh chỉnh Có giám sát (SFT) và Học tăng cường từ Phản hồi Người dùng (RLHF).
Phân tích quy luật mở rộng và hành vi mô hình: Giải thích các khái niệm về Quy luật Mở rộng (Scaling Laws), Khả năng nổi bật (học trong ngữ cảnh, Chuỗi Tư duy), và hiện tượng Hư cấu (Hallucinations).

Đi sâu vào Mô hình Ngôn ngữ Lớn

Bài học

Lesson

Tổng quan khóa học

📚 Tóm tắt nội dung

🎯 Mục tiêu học tập

Bài học