Kembali ke Kursus
AI025 Professional

Sistem RAG Praktis: Dari Basis Pengetahuan ke Generasi Berbasis Pencarian

Catatan kuliah mahasiswa ini memberikan pandangan tingkat sistem dalam membangun sistem Retrieval-Augmented Generation (RAG) yang dapat digunakan. Mata kuliah ini mencakup seluruh proses mulai dari pengambilan data, strategi pembagian teks, pemetaan embedding, penyimpanan vektor, pencarian hibrida, re-ranking, serta evaluasi untuk aplikasi AI yang dapat dipercaya.

5.0
15.0h
619 siswa
0 suka
Kecerdasan Buatan
Mulai Belajar

Gambaran Umum Kursus

📚 Ringkasan Konten

Catatan kuliah mahasiswa ini menyajikan pandangan tingkat sistem dalam membangun sistem Retrieval-Augmented Generation (RAG) yang dapat digunakan. Mata kuliah ini mencakup seluruh pipeline, termasuk pengambilan data, strategi pemecahan, pemetaan embedding, penyimpanan vektor, pencarian hibrida, reranking, serta evaluasi untuk aplikasi AI yang dapat dipercaya.

Kuasai seni membangun sistem AI yang berbasis bukti melalui pendekatan pipeline RAG secara komprehensif.

Penulis: EvoClass

Ucapan Terima Kasih: Tim EvoClass

🎯 Tujuan Pembelajaran

  1. Membedakan antara prompting, fine-tuning, dan RAG untuk memilih alat yang tepat sesuai kebutuhan bisnis tertentu.
  2. Memetakan alur informasi dalam pipeline RAG, dari pertanyaan pengguna hingga generasi yang didukung bukti.
  3. Merancang pipeline pengambilan data profesional yang mencakup metadata, normalisasi, dan versioning untuk mencegah kegagalan akibat "data lemah".
  4. Evaluasi dan implementasi berbagai strategi pemecahan (Fixed-length, Structure-aware, Hierarchical) berdasarkan kebutuhan domain spesifik.
  5. Jelaskan mekanisme embedding dan perbedaan antara kesamaan semantik dan manfaat jawaban.
  6. Jelaskan teori teknis tentang penyimpanan vektor dan indeksasi, dengan fokus pada kompromi antara kecepatan pencarian (latensi) dan akurasi.
  7. Merancang rencana pencarian bertahap untuk korpus skala besar (100.000+ bagian), termasuk strategi metadata dan filter.
  8. Membedakan tujuan pencarian (recall) dan reranking (presisi/relevansi).
  9. Menganalisis mengapa reranking penting untuk generasi LLM yang efektif dan bagaimana interaksinya dengan desain bagian.
  10. Merancang struktur metadata awal yang mendukung kutipan otomatis dan pencarian yang memperhatikan versi.

🔹 Pelajaran 1: Dasar-Dasar RAG dan Pembangunan Basis Pengetahuan

Gambaran Umum: Pelajaran ini menegaskan transisi dari model bahasa besar (LLM) sebagai mesin generasi terisolasi menjadi sistem yang berbasis bukti yang memanfaatkan pengetahuan eksternal. Mahasiswa akan mempelajari pipeline arsitektural Retrieval-Augmented Generation (RAG), memahami mengapa tata kelola data adalah tulang punggung kualitas model, serta menemukan cara merancang proses pengambilan data yang menjamin keandalan fakta melalui metadata dan versioning.

Hasil Pembelajaran:

  • Membedakan antara prompting, fine-tuning, dan RAG untuk memilih alat yang tepat sesuai kebutuhan bisnis tertentu.
  • Memetakan alur informasi melalui pipeline RAG, dari pertanyaan pengguna hingga generasi yang didukung bukti.
  • Merancang pipeline pengambilan data profesional yang mencakup metadata, normalisasi, dan versioning untuk mencegah kegagalan akibat "data lemah".

🔹 Pelajaran 2: Transformasi Data: Pemecahan, Embedding, dan Indeksasi

Gambaran Umum: Pelajaran ini mengeksplorasi transisi kritis dari teks mentah ke struktur data yang dapat dicari dalam pipeline RAG. Ini mencakup pemilihan strategis "unit pencarian" melalui berbagai metode pemecahan, representasi matematis makna melalui embedding, serta infrastruktur teknis yang diperlukan agar pencarian dimensi tinggi tetap efisien dalam skala besar.

Hasil Pembelajaran:

  • Evaluasi dan implementasi berbagai strategi pemecahan (Fixed-length, Structure-aware, Hierarchical) berdasarkan kebutuhan domain spesifik.
  • Jelaskan mekanisme embedding dan perbedaan antara kesamaan semantik dan manfaat jawaban.
  • Jelaskan teori teknis tentang penyimpanan vektor dan indeksasi, dengan fokus pada kompromi antara kecepatan pencarian (latensi) dan akurasi.

🔹 Pelajaran 3: Optimalisasi Pencarian Lanjutan: Pencarian Hibrida dan Reranking

Gambaran Umum: Pelajaran ini membahas transisi dari pencarian vektor dasar menuju arsitektur pencarian produksi. Fokusnya pada Pencarian Hibrida—gabungan pencarian leksikal dan semantik—serta Pipeline Pencarian Dua Tahap, di mana reranker digunakan untuk memastikan bukti yang paling "mengandung jawaban" sampai ke LLM. Mahasiswa akan belajar merancang rencana pencarian untuk korpus skala besar dan memahami interaksi krusial antara kualitas peranking dan akurasi generasi.

Hasil Pembelajaran:

  • Merancang rencana pencarian bertahap untuk korpus skala besar (100.000+ bagian), termasuk strategi metadata dan filter.
  • Membedakan tujuan pencarian (recall) dan reranking (presisi/relevansi).
  • Menganalisis mengapa reranking penting untuk generasi LLM yang efektif dan bagaimana interaksinya dengan desain bagian.

🔹 Pelajaran 4: Kepercayaan dan Kualitas: Kutipan, Kesegaran, dan Evaluasi

Gambaran Umum: Pelajaran ini berfokus pada transisi dari prototipe yang terdengar masuk akal menuju aplikasi RAG yang dapat dipercaya dan siap produksi. Ini mengeksplorasi bagaimana desain metadata memungkinkan kutipan yang andal dan akurasi temporal (kesegaran), serta menyediakan kerangka multi-lapis untuk mengevaluasi tahap pencarian dan generasi guna melampaui demo yang menyesatkan.

Hasil Pembelajaran:

  • Merancang struktur metadata awal yang mendukung kutipan otomatis dan pencarian yang memperhatikan versi.
  • Melaksanakan strategi kesegaran yang menyeimbangkan kemutakhiran dokumen dengan status otoritatif.
  • Membuat set benchmark komprehensif dan melakukan analisis kesalahan diagnostik untuk mengidentifikasi kegagalan spesifik dalam pipeline.

🔹 Pelajaran 5: Dari Prototipe ke Produksi: Integrasi dan Sintesis Pipeline

Gambaran Umum: Pelajaran ini beralih dari komponen RAG teoretis ke realitas praktis membangun aplikasi siap produksi. Fokusnya adalah mengintegrasikan tahapan individu menjadi arsitektur akhir yang koheren, di mana keberhasilan didefinisikan oleh observabilitas, penanganan kegagalan yang efektif, serta manajemen hati-hati terhadap kompromi sistem yang melekat. Mahasiswa akan belajar bahwa sistem yang dapat digunakan adalah sistem yang mengutamakan pelacakan bukti dan perilaku yang baik meskipun kompleksitasnya tinggi.

Hasil Pembelajaran:

  • Peta arsitektur end-to-end praktis 9 tahap untuk sistem RAG.
  • Identifikasi dan evaluasi kompromi krusial antara kinerja, akurasi, dan biaya.
  • Diagnosis kegagalan pipeline dengan melacak kesalahan kembali ke tahap arsitektural tertentu.