Dasar-Dasar Kecerdasan Buatan Generatif dalam Python
Panduan komprehensif untuk memahami dan menerapkan Kecerdasan Buatan Generatif dan Model Bahasa Besar (LLM). Kursus ini membahas transisi dari dasar teoritis hingga pengembangan praktis berbasis Python, mencakup GAN, model difusi, transformer, fine-tuning, serta penempatan produksi.
Pelajaran
Gambaran Umum Kursus
📚 Ringkasan Konten
Panduan komprehensif untuk memahami dan menerapkan Kecerdasan Buatan Generatif dan Model Bahasa Besar (LLM). Kursus ini membahas transisi dari fondasi teoretis hingga pengembangan praktis berbasis Python, mencakup GAN, model difusi, transformer, fine-tuning, serta penempatan produksi.
Kelola prinsip dasar dan aplikasi praktis LLM modern serta teknik generatif dengan Python.
Penulis: Carlos Rodriguez
Ucapan Terima Kasih: Ucapan khusus kepada istri penulis, Jill, orang tua penulis, serta para reviewer teknis Morgan Boyce, Eric Rui, dan Samira Shaikh (penulis kata pengantar).
🎯 Tujuan Pembelajaran
- Membedakan antara paradigma pembelajaran mesin klasik (diskriminatif) dan model AI generatif.
- Mengidentifikasi arsitektur dasar AI generatif, termasuk GAN, model difusi, dan Transformer.
- Menerangkan peran dan evolusi Model Bahasa Besar (LLM) dalam lingkup kecerdasan buatan yang lebih luas.
- Membedakan fitur unik dan paradigma arsitektur GAN, model difusi, dan transformer.
- Menganalisis kemajuan dan keterbatasan setiap jenis model, termasuk masalah spesifik seperti kolaps mode atau kecepatan sampling.
- Menerapkan pipeline Stable Diffusion dan mengevaluasi hasil generasi menggunakan logits dan probabilitas berbasis CLIP.
- Melacak evolusi NLP dari metode berbasis hitungan awal dan RNN hingga representasi terdistribusi modern dan pembelajaran transfer.
- Menerangkan mekanisme teknis Multi-head Attention (MHA), Self-attention, Masking, dan Jaringan Feed-Forward (FFN).
- Menerapkan arsitektur model Transformer lengkap, termasuk tokenisasi data, encoding posisi, dan fungsi pelatihan/inferensi.
- Menghubungkan fitur prototipe (misalnya Google Colab) ke lingkungan siap produksi menggunakan Docker dan VS Code.
🔹 Pelajaran 1: Fondasi dan Paradigma AI Generatif
Gambaran Umum: Pelajaran ini menetapkan pergeseran fundamental dari paradigma pembelajaran mesin klasik menuju era AI generatif. Ini menjelajahi evolusi arsitektur—dari GAN hingga Transformer—dan memperkenalkan Model Bahasa Besar (LLM) sebagai fondasi pemahaman sintetik dan generasi konten.
Hasil Pembelajaran:
- Membedakan antara paradigma pembelajaran mesin klasik (diskriminatif) dan model AI generatif.
- Mengidentifikasi arsitektur dasar AI generatif, termasuk GAN, model difusi, dan Transformer.
- Menerangkan peran dan evolusi Model Bahasa Besar (LLM) dalam lingkup kecerdasan buatan yang lebih luas.
🔹 Pelajaran 2: Tinjauan Arsitektur: GAN, Model Difusi, dan Transformer
Gambaran Umum: Pelajaran ini memberikan tinjauan komprehensif tentang tiga pilar arsitektur utama AI generatif: Jaringan Adversarial Generatif (GAN), Model Difusi, dan Transformer. Siswa akan mengeksplorasi dekonstruksi teknis metode-metode ini, kemajuan evolusioner, keterbatasan inheren, serta aplikasi praktis dalam generasi gambar dan evaluasi menggunakan metrik CLIP dalam lingkungan Jupyter/Colab.
Hasil Pembelajaran:
- Membedakan fitur unik dan paradigma arsitektur GAN, model difusi, dan transformer.
- Menganalisis kemajuan dan keterbatasan setiap jenis model, termasuk masalah spesifik seperti kolaps mode atau kecepatan sampling.
- Menerapkan pipeline Stable Diffusion dan mengevaluasi hasil generasi menggunakan logits dan probabilitas berbasis CLIP.
🔹 Pelajaran 3: Evolusi NLP dan Arsitektur Transformer
Gambaran Umum: Pelajaran ini melacak lintasan historis Pemrosesan Bahasa Alami (NLP), dari metode statistik awal hingga arsitektur Transformer yang revolusioner. Ini mencakup transisi dari model berbasis RNN secara urutan menjadi mekanisme self-attention yang dapat diparalelkan, mendetailkan komponen-komponen spesifik Transformer asli (Encoder/Decoder), serta implementasi praktis pipa terjemahan menggunakan PyTorch.
Hasil Pembelajaran:
- Melacak evolusi NLP dari metode berbasis hitungan awal dan RNN hingga representasi terdistribusi modern dan pembelajaran transfer.
- Menerangkan mekanisme teknis Multi-head Attention (MHA), Self-attention, Masking, dan Jaringan Feed-Forward (FFN).
- Menerapkan arsitektur model Transformer lengkap, termasuk tokenisasi data, encoding posisi, dan fungsi pelatihan/inferensi.
🔹 Pelajaran 4: Teknik Produksi dan Pelaksanaan AI Bertanggung Jawab
Gambaran Umum: Pelajaran ini membahas transisi kritis dari prototipe pembelajaran mesin (fase eksperimental) menuju pelaksanaan yang stabil dan siap produksi. Ini mengintegrasikan prinsip teknik produksi—seperti containerisasi dengan Docker dan pemetaan lingkungan—dengan imperatif etika AI Bertanggung Jawab, fokus pada mitigasi bias, transparansi, serta benchmarking model ketat menggunakan metrik seperti skor CLIP dan kesamaan leksikal.
Hasil Pembelajaran:
- Menghubungkan fitur prototipe (misalnya Google Colab) ke lingkungan siap produksi menggunakan Docker dan VS Code.
- Menghitung kompleksitas komputasi model dan kebutuhan memori untuk menentukan kebutuhan perangkat keras khusus.
- Mengevaluasi model generatif menggunakan metrik kuantitatif (BLEU, ROUGE, METEOR) dan keselarasan dengan CLIP.
🔹 Pelajaran 5: Teknik Fine-Tuning dan Pembelajaran Efisien Parameter
Gambaran Umum: Pelajaran ini membahas transisi dari adaptasi model berbasis prompt ke fine-tuning khusus tugas. Ini mengeksplorasi Pembelajaran dalam Konteks (Zero-shot dan Few-shot), Generasi Berbasis Pemulihan (RAG), dan implementasi praktis Fine-Tuning Efisien Parameter (PEFT) menggunakan Python. Siswa akan belajar membuat pipa jawaban pertanyaan, menggunakan kelas Trainer Hugging Face, serta mengevaluasi hasil menggunakan loss pelatihan dan kesamaan semantik.
Hasil Pembelajaran:
- Membedakan antara Pembelajaran dalam Konteks (Zero/Few-shot), RAG, dan Fine-tuning.
- Menerapkan alur kerja fine-tuning berbasis PEFT menggunakan AdaLoRA dan kelas
TrainerHugging Face. - Menghitung dan menafsirkan metrik kinerja model, termasuk skor loss pelatihan dan kesamaan semantik.
🔹 Pelajaran 6: Adaptasi Domain untuk Model Bahasa Besar Spesialis
Gambaran Umum: Pelajaran ini menjelajahi transisi Model Bahasa Besar (LLM) dari alat umum menjadi ahli khusus di bidang keuangan. Siswa akan mempelajari konteks historis adaptasi domain, menguasai metodologi pelatihan inti seperti Modeling Bahasa Kausal (CLM) dan Prediksi Kalimat Selanjutnya (NSP), serta menjalankan proyek pembelajaran transfer secara langsung menggunakan Fine-Tuning Efisien Parameter (PEFT). Modul ini diakhiri dengan teknik evaluasi ketat menggunakan metrik ROUGE dan skor klasifikasi tradisional (Presisi, Recall, F1).
Hasil Pembelajaran:
- Menjelaskan sejarah dan pentingnya krusial dalam menyesuaikan LLM umum ke domain khusus.
- Menjalankan seluruh pipa pembelajaran transfer domain keuangan, termasuk pra-pemrosesan dan tokenisasi.
- Membedakan antara metodologi pelatihan CLM dan NSP.
🔹 Pelajaran 7: Teknik Engineering Prompt Lanjutan dan Implementasi Pemulihan
Gambaran Umum: Pelajaran ini mengeksplorasi evolusi interaksi Model Bahasa Besar (LLM), bergerak dari fine-tuning tradisional menuju pendekatan berbasis prompt. Ini mendetailkan penggunaan strategis persona, permainan peran situasional, serta implementasi Generasi Berbasis Pemulihan (RAG) menggunakan LlamaIndex untuk menciptakan respons AI yang sadar konteks, aman, dan selaras merek.
Hasil Pembelajaran:
- Menjelaskan transisi dari fine-tuning berparameter berat ke inferensi berbasis prompt yang efisien.
- Merancang dan menerapkan persona dan permainan peran situasional untuk mengarahkan perilaku model dan distribusi output.
- Membangun pipa RAG yang berfungsi menggunakan Python dan kerangka kerja LlamaIndex.