EvoClass | Education That Evolves With You

📚 Ringkasan Konten

Kursus ini menyediakan pengantar komprehensif dan mendalam mengenai evolusi Model Bahasa Besar (LLM), arsitektur teknis inti, paradigma pelatihan (pre-training, fine-tuning, dan alignment), ekstensi multimodal, teknik prompt engineering, Chain of Thought (CoT), agen, serta topik terdepan seperti keamanan model dan perlindungan privasi.

Analisis mendalam mengenai evolusi teknologi dan keselarasan keamanan model besar secara menyeluruh, mulai dari pre-training hingga agen umum.

🎯 Tujuan Pembelajaran

Membedakan antara arsitektur model: Mengidentifikasi perbedaan struktural dan kasus penggunaan untuk model Encoder-only, Decoder-only, dan Encoder-Decoder.
Menjelaskan Pipeline Pelatihan LLM: Mendeskripsikan transisi dari pre-training berbasis self-supervised ke Supervised Fine-Tuning (SFT) dan Reinforcement Learning from Human Feedback (RLHF).
Menganalisis Skala dan Perilaku Model: Menjelaskan konsep Hukum Skala, Kemampuan Muncul (pembelajaran dalam konteks, Chain of Thought), serta fenomena Halusinasi.
Menganalisis perbedaan struktur antara arsitektur Encoder-only (BERT), Decoder-only (GPT), dan Encoder-Decoder (T5).
Menjelaskan proses pelatihan tiga tahap: Pre-training (model dasar), Instruction Tuning (SFT), dan Alignment (RLHF/PPO).
Membandingkan kinerja, hukum skala, dan inovasi arsitektur dari LLM utama seperti GPT, Llama, Qwen, dan DeepSeek.
Menerapkan strategi prompting zero-shot dan few-shot untuk ekstraksi dan klasifikasi data terstruktur.
Mengkalibrasi hipertes (Temperature, Top P, Penalti) untuk menyeimbangkan output kreatif dan deterministik.
Membangun prompt Chain-of-Thought (CoT) yang efektif menggunakan metode manual, otomatis, dan zero-shot ("Mari kita pikir langkah demi langkah").
Menganalisis dan Membandingkan Varian CoT: Membedakan antara Self-Consistency, Program of Thought (PoT), Tree-of-Thought (ToT), dan Graph-of-Thought (GoT).

Gambaran Umum: Pelajaran ini menjelajahi keseimbangan krusial antara utilitas Model Bahasa Besar (LLM) dan keamanan, dengan fokus pada mekanisme serangan "jailbreak" dan implementasi teknis steganografi. Ini mencakup bagaimana penyerang melewati filter keamanan menggunakan rekayasa prompt canggih (misalnya, DAN, STAN) dan bagaimana LLM dapat digunakan untuk komunikasi tersembunyi dengan menyisipkan data dalam proses generasi token. Selain itu, diperkenalkan arsitektur dan kemampuan Model Bahasa Besar Multimodal (MLLM) dalam memproses dan menghasilkan berbagai jenis data seperti gambar, audio, dan video.

Hasil Pembelajaran:

Mengidentifikasi dan menganalisis pola serangan jailbreak umum, termasuk role-playing (DAN), paksaan kognitif (PUA), dan metode side-channel (cipher/kode).
Menjelaskan mekanisme teknis steganografi LLM, khususnya bagaimana bitstream dipetakan ke distribusi probabilitas (logits) prediksi token berikutnya.
Mengkategorikan arsitektur MLLM berdasarkan kemampuan mereka dalam memahami dan menghasilkan berbagai modality (Teks, Gambar, Audio, 3D).

Mendalami Model Bahasa Besar

Pelajaran

Lesson

Gambaran Umum Kursus

📚 Ringkasan Konten

🎯 Tujuan Pembelajaran

Pelajaran