AI025 Nghề nghiệp

Hệ thống RAG Thực tiễn: Từ Cơ sở Kiến thức đến Tăng cường Truy xuất

Các ghi chú bài giảng dành cho sinh viên cung cấp cái nhìn hệ thống về việc xây dựng các hệ thống RAG (Retrieval-Augmented Generation) có thể sử dụng được. Khóa học bao gồm toàn bộ quy trình từ nhập dữ liệu, chiến lược chia nhỏ dữ liệu, ánh xạ nhúng, lưu trữ vector, truy xuất kết hợp, tái xếp hạng đến đánh giá nhằm đảm bảo các ứng dụng AI đáng tin cậy.

5.0

15.0h

619 học viên

5 lessons

0 lượt thích

Trí tuệ nhân tạo

Bắt đầu học

Tổng quan khóa học

📚 Tóm tắt nội dung

Các ghi chú bài giảng sinh viên này cung cấp cái nhìn hệ thống về việc xây dựng các hệ thống Truy xuất Tăng cường Sinh (RAG) có thể sử dụng được. Khóa học bao quát toàn bộ quy trình từ tiếp nhận dữ liệu, chiến lược chia nhỏ văn bản, ánh xạ nhúng, lưu trữ vector, truy xuất kết hợp, sắp xếp lại kết quả, đến đánh giá nhằm ứng dụng trí tuệ nhân tạo đáng tin cậy.

Nắm vững nghệ thuật xây dựng các hệ thống AI dựa trên bằng chứng thông qua một phương pháp RAG toàn diện.

Tác giả: EvoClass

Ghi nhận: Đội ngũ EvoClass

🎯 Mục tiêu học tập

Phân biệt giữa cách đặt câu hỏi (prompting), tinh chỉnh mô hình (fine-tuning) và RAG để lựa chọn công cụ phù hợp với yêu cầu kinh doanh cụ thể.
Xác định luồng thông tin trong pipeline RAG, từ truy vấn người dùng đến sinh ra kết quả có căn cứ.
Thiết kế một pipeline tiếp nhận dữ liệu chuyên nghiệp, tích hợp metadata, chuẩn hóa và phiên bản hóa để tránh những lỗi do "dữ liệu yếu".
Đánh giá và triển khai các chiến lược chia nhỏ khác nhau (độ dài cố định, ý thức cấu trúc, phân cấp) dựa trên yêu cầu lĩnh vực cụ thể.
Giải thích cơ chế hoạt động của nhúng (embeddings) và sự khác biệt giữa tương đồng ngữ nghĩa và độ hữu ích của câu trả lời.
Mô tả lý thuyết kỹ thuật về kho vector và chỉ mục, tập trung vào sự đánh đổi giữa tốc độ truy xuất (thời gian trễ) và độ chính xác.
Thiết kế kế hoạch truy xuất đa giai đoạn cho một tập tài liệu quy mô lớn (trên 100.000 mảnh) bao gồm chiến lược lọc và metadata.
Phân biệt mục tiêu của truy xuất (tính đầy đủ - recall) và sắp xếp lại (tính chính xác/độ liên quan - precision/relevance).
Phân tích lý do tại sao sắp xếp lại là thiết yếu cho việc sinh câu trả lời hiệu quả từ LLM và mối tương tác của nó với thiết kế mảnh văn bản.
Thiết kế cấu trúc metadata phía trước hỗ trợ trích dẫn tự động và truy xuất có hiểu biết về phiên bản.

Bài học 共 5 课时 · 预计 15.0h

1 Cơ sở của RAG và Xây dựng Cơ sở Kiến thức

2 Chuyển đổi Dữ liệu: Chia nhỏ, Nhúng và Chỉ mục

3 Tối ưu hóa Truy xuất Nâng cao: Tìm kiếm Kết hợp và Sắp xếp lại

4 Tin cậy và Chất lượng: Trích dẫn, Độ mới và Đánh giá

5 Từ Prototype đến Sản xuất: Tích hợp và Tổng hợp Pipeline

Bài học

Lesson

1 Lesson 1

This lesson introduces Retrieval-Augmented Generation (RAG) as a solution to the limitations of static, "closed-book" LLMs by grounding model responses in dynamic, external knowledge bases. Students will learn to identify the core components of the RAG lifecycle and understand how to design effective document ingestion and retrieval pipelines to ensure factual reliability and traceability.

2 Lesson 2

This lesson explores the strategic importance of data transformation in RAG systems, focusing on how chunking strategies, embedding models, and indexing algorithms impact retrieval performance. Students will learn to balance the precision-recall paradox by defining optimal retrieval units that maintain semantic coherence while managing latency and token constraints.

3 Lesson 3

This lesson explores advanced retrieval optimization by contrasting the semantic strengths of dense vector search with the precision of lexical BM25 retrieval. Students will learn to implement hybrid search architectures, including Reciprocal Rank Fusion (RRF) and Cross-Encoder reranking, to effectively balance semantic intent with exact keyword matching in production RAG systems.

4 Lesson 4

This lesson explores the "Demo Paradox" in Retrieval-Augmented Generation, emphasizing that system reliability depends on integrated pipelines rather than isolated metrics. Students will learn how to ensure trustworthiness through metadata persistence, traceability, and rigorous observability across all stages of the RAG architecture.

5 Lesson 5