Quay lại Khóa học
AI012 Professional

Đi sâu vào Mô hình Ngôn ngữ Lớn

Khóa học này cung cấp một giới thiệu toàn diện và sâu sắc về lịch sử phát triển của các mô hình ngôn ngữ lớn (LLMs), kiến trúc kỹ thuật cốt lõi, các phương pháp huấn luyện (tiền huấn luyện, tinh chỉnh và đồng bộ hóa), các mở rộng đa phương tiện, kỹ thuật lập trình lời nhắc, suy luận chuỗi suy nghĩ, các tác nhân, cũng như những chủ đề tiên phong như an toàn mô hình và bảo vệ quyền riêng tư.

4.9
24.0h
1067 học viên
0 lượt thích
Trí tuệ nhân tạo
Bắt đầu học

Tổng quan khóa học

📚 Tóm tắt nội dung

Khóa học này cung cấp một giới thiệu toàn diện và sâu sắc về quá trình phát triển của các Mô hình Ngôn ngữ Lớn (LLM), kiến trúc kỹ thuật cốt lõi, các phương pháp huấn luyện (tiền huấn luyện, tinh chỉnh, điều chỉnh phù hợp), mở rộng đa phương tiện, kỹ thuật lập trình lời nhắc (prompt engineering), Chuỗi Tư duy (CoT), các tác nhân (agents), cũng như những chủ đề tiên phong như an toàn mô hình và bảo vệ quyền riêng tư.

Phân tích sâu về sự tiến hóa công nghệ và việc điều chỉnh phù hợp về an toàn trong các mô hình lớn toàn bộ hệ thống, từ giai đoạn tiền huấn luyện đến các tác nhân tổng quát.

🎯 Mục tiêu học tập

  1. Phân biệt các kiến trúc mô hình: Nhận diện sự khác biệt về cấu trúc và các trường hợp sử dụng giữa các mô hình Encoder-only, Decoder-only và Encoder-Decoder.
  2. Giải thích quy trình huấn luyện LLM: Mô tả quá trình chuyển đổi từ tiền huấn luyện tự giám sát sang Tinh chỉnh Có giám sát (SFT) và Học tăng cường từ Phản hồi Người dùng (RLHF).
  3. Phân tích quy luật mở rộng và hành vi mô hình: Giải thích các khái niệm về Quy luật Mở rộng (Scaling Laws), Khả năng nổi bật (học trong ngữ cảnh, Chuỗi Tư duy), và hiện tượng Hư cấu (Hallucinations).
  4. Phân tích sự khác biệt về cấu trúc giữa các kiến trúc Encoder-only (BERT), Decoder-only (GPT), và Encoder-Decoder (T5).
  5. Giải thích quy trình huấn luyện ba giai đoạn: Tiền huấn luyện (mô hình cơ sở), Điều chỉnh Hướng dẫn (SFT), và Điều chỉnh Phù hợp (RLHF/PPO).
  6. So sánh hiệu suất, quy luật mở rộng và các đổi mới kiến trúc của các LLM hàng đầu như GPT, Llama, Qwen và DeepSeek.
  7. Triển khai chiến lược lập trình lời nhắc zero-shot và few-shot để trích xuất và phân loại dữ liệu có cấu trúc.
  8. Điều chỉnh siêu tham số mô hình (Temperature, Top P, Penalty) để cân bằng giữa đầu ra sáng tạo và xác định.
  9. Xây dựng các lời nhắc Chuỗi Tư duy (CoT) hiệu quả bằng các phương pháp thủ công, tự động và zero-shot ("Hãy suy nghĩ từng bước").
  10. Phân tích và so sánh các biến thể CoT: Phân biệt giữa Tự nhất quán (Self-Consistency), Chương trình Tư duy (PoT), Cây Tư duy (ToT), và Đồ thị Tư duy (GoT).

Bài học