AI Magic Lab
โครงสร้างหลักสูตรที่เข้มข้น รวมหัวข้อสำคัญ 4 หัวข้อ: พื้นฐานปัญญาประดิษฐ์ (AI Fundamentals), การสร้างโมเดลขนาดใหญ่ (GenAI และ LLM), ตัวแทนและคอมพิวเตอร์วิวัฒนาการ (เน้นเป็นคุณสมบัติของ PolyU) และจริยธรรม ลำดับตรรกะของหลักสูตรเริ่มจากความเข้าใจและการจัดการข้อมูล (บทที่ 1-3), ความรู้เชิงปัญญาและการสร้างสรรค์ (บทที่ 4-6), ตัวแทนและกระบวนการวิวัฒนาการ (บทที่ 7-9) และจบลงด้วยประเด็นจริยธรรมและอนาคต (บทที่ 10)
ภาพรวมคอร์สเรียน
📚 สรุปเนื้อหา
"ห้องแล็บเวทมนตร์ปัญญาประดิษฐ์" เป็นหลักสูตรที่เข้มข้นและมีโครงสร้างเชื่อมโยงกัน ออกแบบมาเพื่อให้ผู้เรียนเข้าใจลึกซึ้งและเป็นลำดับขั้นตอนเกี่ยวกับปัญญาประดิษฐ์สมัยใหม่ โดยหลักสูตรแบ่งออกเป็น 4 โมดูลที่พัฒนาไปอย่างต่อเนื่อง ได้แก่ แนวคิดพื้นฐาน (การรับรู้และการจัดเก็บข้อมูล), ความสามารถในการสร้างสรรค์ขั้นสูง (การรับรู้และการสร้างสรรค์ผ่านโมเดลภาษาขนาดใหญ่และโมเดลดิฟฟิวชัน), ระบบอัตโนมัติ (เอเจนต์และคอมพิวเตอร์แบบวิวัฒนาการ) และการกำกับดูแลทางจริยธรรม (จริยธรรมและอนาคต) ผู้เรียนจะก้าวจากความเข้าใจในรูปแบบตัวเลขของข้อมูลไปจนถึงการควบคุมการออกแบบระบบที่ซับซ้อน และจบลงด้วยภาพรวมโดยรวมเกี่ยวกับการสร้างและใช้งานปัญญาประดิษฐ์อย่างมีความรับผิดชอบ
หลักสูตรนี้ให้ความเข้าใจเชิงลึกและครอบคลุมเกี่ยวกับปัญญาประดิษฐ์สมัยใหม่ ครอบคลุมพื้นฐานข้อมูลสำคัญ วิธีการสร้างสรรค์ด้วยโมเดลภาษาขนาดใหญ่ (LLM) สถาปัตยกรรมของเอเจนต์อัตโนมัติ และประเด็นจริยธรรมสำคัญที่จำเป็นสำหรับการใช้งานอย่างรับผิดชอบ
🎯 วัตถุประสงค์การเรียนรู้
- เข้าใจพื้นฐานการรับรู้ของปัญญาประดิษฐ์ การแทนข้อมูล (เทนเซอร์) และงานพื้นฐานที่เกี่ยวข้องกับการเรียนรู้ภายใต้การควบคุม เช่น การจัดประเภท
- เข้าใจและควบคุมโมเดลภาษาขนาดใหญ่ (LLM) และปัญญาประดิษฐ์เชิงสร้างสรรค์ โดยใช้แนวคิดการคาดการณ์ลำดับ กลไกการจดจ่อ (Attention Mechanism) และเทคนิคการเขียนคำสั่งขั้นสูง (Prompt Engineering)
- ออกแบบและวิเคราะห์เอเจนต์อัจฉริยะ โดยรวมวงจรการรับรู้-ตัดสินใจ-กระทำ (Perception-Decision-Action) กับวิธีการปรับแต่งแบบประชากร (population-based optimization) เช่น การคำนวณวิวัฒนาการ
- แยกแยะระหว่างปัญญาประดิษฐ์เชิงสร้างสรรค์ (Generative) และปัญญาประดิษฐ์เชิงแยกแยะ (Discriminative) และอธิบายกระบวนการทางกลไกของโมเดลดิฟฟิวชันสำหรับการสร้างภาพจากข้อความ
- ประเมินปัญหาจริยธรรมที่เกิดขึ้นในปัญญาประดิษฐ์สมัยใหม่ (อคติของข้อมูล โมเดลที่สร้างภาพเท็จ วิดีโอปลอม) และเสนอแนวทางสำหรับความสัมพันธ์ระหว่างมนุษย์กับปัญญาประดิษฐ์อย่างรับผิดชอบ
🔹 บทเรียนที่ 1: ตาดิจิทัลของเครื่องจักร
บทนำ: บทเรียนพื้นฐานนี้สำรวจการรับรู้ของเครื่องจักร เริ่มจากการ พิกเซล และ โมเดลสี RGB ผู้เรียนจะได้เรียนรู้ว่าข้อมูลภาพดิบถูกแปลงเป็นตัวเลขอย่างไร และเหตุผลที่ การมองเห็นด้วยคอมพิวเตอร์ (Computer Vision) ใช้ การดึงลักษณะเฉพาะ (Feature Extraction) กลไกหลักที่นำเสนอคือ คอนโวลูชัน (Convolution) ซึ่งเป็นฟิลเตอร์ดิจิทัลที่ใช้ตรวจจับลักษณะระดับต่ำ เช่น ขอบ แปลงภาพที่มองเห็นได้เป็นเมทริกซ์ตัวเลขที่มีโครงสร้าง เพื่อเตรียมสำหรับการประมวลผลด้วยปัญญาประดิษฐ์ในขั้นตอนต่อไป ผลลัพธ์การเรียนรู้:
- อธิบายหน้าที่ของพิกเซล ค่าสี RGB และความละเอียดในการสร้างภาพดิจิทัล
- อธิบายความจำเป็นของการมองเห็นด้วยคอมพิวเตอร์ (CV) และการดึงลักษณะเฉพาะในการรับรู้ของเครื่องจักร
- สร้างแนวคิดเกี่ยวกับคอนโวลูชันในฐานะ "ฟิลเตอร์ดิจิทัล" ที่ใช้ตรวจจับลักษณะระดับต่ำ เช่น ขอบและมุม
- เข้าใจว่าข้อมูลภาพทั้งหมดในท้ายที่สุดถูกแทนด้วยเมทริกซ์ตัวเลขที่มีโครงสร้างเพื่อการประมวลผลด้วยปัญญาประดิษฐ์
🔹 บทเรียนที่ 2: หน่วยพื้นฐานของข้อมูล (เทนเซอร์)
บทนำ: บทเรียนสำคัญนี้เปลี่ยนจากข้อมูลการรับรู้ดิบ มาสู่รูปแบบการแทนค่าทางคณิตศาสตร์ที่มีโครงสร้าง เราจัดประเภทข้อมูลที่ไม่มีโครงสร้าง (ข้อความ วิดีโอ เสียง ภาพ) และแนะนำ เทนเซอร์ — ภาชนะหลายมิติที่เป็นภาษาสากลสำหรับการคำนวณทุกอย่างในปัญญาประดิษฐ์ เราแสดงให้เห็นว่าข้อมูลแต่ละประเภทถูกแทนด้วยเทนเซอร์อย่างไร และกำหนดความสัมพันธ์ระหว่างอินพุต/เอาต์พุต (I/O) อย่างสำคัญ กระบวนการ การเตรียมข้อมูล (Preprocessing) (การทำความสะอาด การปรับขนาด และการมาตรฐาน) ถูกครอบคลุมเป็นข้อกำหนดเบื้องต้นก่อนการฝึกโมเดลอย่างมีประสิทธิภาพ ผลลัพธ์การเรียนรู้:
- กำหนดลักษณะหลักของข้อมูลที่ไม่มีโครงสร้าง (ข้อความ ภาพ เสียง) และอธิบายเหตุผลที่จำเป็นต้องแปลง
- แยกแยะเชิงคณิตศาสตร์ระหว่างเวกเตอร์ (1 มิติ) กับเทนเซอร์ (ภาชนะหลายมิติ)
- อธิบายว่าเทนเซอร์ทำหน้าที่เป็นโครงสร้างอินพุต/เอาต์พุตสากลสำหรับเครือข่ายประสาทเทียมทุกชนิด
- สรุปขั้นตอนและเป้าหมายหลักของการเตรียมข้อมูล (การทำความสะอาดและมาตรฐาน) ก่อนการฝึกโมเดล
🔹 บทเรียนที่ 3: ผู้เชี่ยวชาญด้านการจัดประเภท
บทนำ: เน้นไปที่ การเรียนรู้ภายใต้การควบคุม (Supervised Learning) บทเรียนนี้อธิบายว่าปัญญาประดิษฐ์ใช้ข้อมูลที่มีโครงสร้างและมีฉลากเพื่อทำหน้าที่ซับซ้อนได้อย่างไร งานหลักคือ การจัดประเภท (Classification) ซึ่งโมเดลเรียนรู้ที่จะจัดกลุ่มข้อมูลโดยวาดเส้น ขอบเขตการตัดสินใจ (Decision Boundary) อย่างเปรียบเทียบ เราประเมินประสิทธิภาพของโมเดลโดยใช้ ความแม่นยำ (Accuracy) และสำรวจจุดบกพร่องหลักคือ การเกินความเหมาะสม (Overfitting) ซึ่งโมเดลไม่สามารถนำไปใช้กับข้อมูลใหม่ที่ไม่เคยเห็นมาก่อนได้ ผลลัพธ์การเรียนรู้:
- นิยามการเรียนรู้ภายใต้การควบคุม และระบุบทบาทของข้อมูลฝึกอบรมและฉลาก
- อธิบายวัตถุประสงค์ของการจัดประเภท และแสดงภาพการตั้งขอบเขตการตัดสินใจของโมเดล
- คำนวณหรือตีความประสิทธิภาพของโมเดลโดยใช้เมตริกความแม่นยำ
- วิเคราะห์และอธิบายแนวคิดการเกินความเหมาะสม และผลกระทบเชิงลบต่อความสามารถในการสรุปผลทั่วไปของปัญญาประดิษฐ์
🔹 บทเรียนที่ 4: การคาดการณ์ภาษาและการจดจ่อ
บทนำ: บทเรียนนี้เปลี่ยนโฟกัสไปที่การสร้างลำดับที่มีพลวัต โดยอธิบายกลไกหลักของโมเดลภาษาขนาดใหญ่ (LLM) เราจำกัดคำว่า โทเค็น (Tokens) และข้อจำกัดของ หน้าต่างบริบท (Context Window) (ความจำระยะสั้นของโมเดล) กระบวนการอาศัย การคาดการณ์ลำดับ (Sequence Prediction) (คำนวณความน่าจะเป็นของโทเค็นถัดไป) และ กลไกการจดจ่อ (Attention Mechanism) ซึ่งช่วยให้โมเดลประเมินความสำคัญของโทเค็นต่าง ๆ ได้อย่างไดนามิก สุดท้าย ผู้เรียนจะได้เรียนรู้ว่าพารามิเตอร์ อุณหภูมิ (Temperature) ควบคุมความสุ่มและความคิดสร้างสรรค์ของผลลัพธ์ที่ได้อย่างไร ผลลัพธ์การเรียนรู้:
- นิยามโทเค็น และอธิบายว่าข้อความถูกแปลงเป็นลำดับเพื่อการประมวลผลในโมเดลภาษาขนาดใหญ่อย่างไร
- แสดงหน้าที่ของหน้าต่างบริบท และอธิบายข้อจำกัดของมันในฐานะความจำระยะสั้นของปัญญาประดิษฐ์
- อธิบายบทบาทของกลไกการจดจ่อในการช่วยให้โมเดลโฟกัสกับข้อมูลที่เกี่ยวข้องในขณะคาดการณ์
- อธิบายการคาดการณ์ลำดับเป็นกระบวนการที่มีความน่าจะเป็น และวิเคราะห์ว่าพารามิเตอร์อุณหภูมิควบคุมความคิดสร้างสรรค์และความสุ่มของผลลัพธ์ของโมเดลอย่างไร
🔹 บทเรียนที่ 5: ศิลปะแห่งการเขียนคำสั่ง (Prompt Engineering)
บทนำ: สร้างบนพื้นฐานทางเทคนิคของการคาดการณ์ของโมเดลภาษาขนาดใหญ่ บทเรียนนี้เน้นการควบคุมผลลัพธ์อย่างแข็งขันโดยใช้ข้อมูลอินพุตที่มีโครงสร้าง โดยมองภาษาเป็นโค้ดระดับสูง เราตั้งโครงสร้างคำสั่งหลัก (คำสั่ง บริบท รูปแบบ) เทคนิคที่ครอบคลุมได้แก่ การตั้งบทบาท (Persona), การเรียนรู้แบบตัวอย่างน้อย (Few-Shot Learning) (ให้ตัวอย่าง) และ โซ่ความคิด (Chain of Thought - CoT) ซึ่งเพิ่มความแม่นยำทางตรรกะโดยต้องการให้คิดเป็นขั้นตอน ผลลัพธ์การเรียนรู้:
- นิยามการเขียนคำสั่ง (Prompt Engineering) และรู้จักภาษาธรรมชาติเป็นแพลตฟอร์มการเขียนโปรแกรมใหม่ที่ใช้ควบคุมโมเดลภาษาขนาดใหญ่
- ใช้เทคนิคการตั้งบทบาท (Persona) และการเรียนรู้แบบตัวอย่างน้อยเพื่อปรับโทน เนื้อหา และความแม่นยำตามรูปแบบผลลัพธ์ที่ต้องการ
- ประยุกต์ใช้เทคนิคโซ่ความคิด (CoT) เพื่อแก้ปัญหาที่ต้องใช้การคิดแบบหลายขั้นตอน และเพิ่มความแม่นยำทางตรรกะ
- ฝึกฝนการปรับปรุงคำสั่งแบบต่อเนื่องเพื่อปรับปรุงและจำกัดผลลัพธ์ที่ได้ตามเป้าหมายที่ต้องการ
🔹 บทเรียนที่ 6: ศิลปะเชิงสร้างสรรค์และกระบวนการดิฟฟิวชัน
บทนำ: บทเรียนนี้เปลี่ยนจากควบคุมข้อมูลข้อความ (บทเรียนที่ 5) มาสู่กลไกทางกลไกของการสร้างสรรค์ เราแยกแยะระหว่าง ปัญญาประดิษฐ์เชิงสร้างสรรค์ (Generative AI) กับ ปัญญาประดิษฐ์เชิงแยกแยะ (Discriminative AI) จุดเน้นหลักคือ โมเดลดิฟฟิวชัน (Diffusion Model) ซึ่งภาพทุกภาพเริ่มต้นจาก สัญญาณรบกวน (Noise) กระบวนการประกอบด้วยการ กำจัดสัญญาณรบกวน (de-noising) แบบวนซ้ำหลายร้อยครั้ง ควบคุมอย่างแม่นยำโดยคำสั่งที่ละเอียด เพื่อให้เกิด การจับคู่ข้อความ-ภาพ (Text-to-Image Alignment) ภายใน พื้นที่เชิงลึก (Latent Space) ผลลัพธ์การเรียนรู้:
- แยกแยะระหว่างโมเดลปัญญาประดิษฐ์เชิงสร้างสรรค์กับเชิงแยกแยะ
- อธิบายหลักการหลักของโมเดลดิฟฟิวชันว่าเป็นกระบวนการกำจัดสัญญาณรบกวนแบบวนซ้ำที่เริ่มจากสัญญาณรบกวนแบบสุ่ม
- อธิบายบทบาทของคำสั่งข้อความในการบรรลุการจับคู่ข้อความ-ภาพ
- ระบุแอปพลิเคชันหลักของโมเดลดิฟฟิวชัน เช่น การถ่ายโอนสไตล์
🔹 บทเรียนที่ 7: วงจรหลักของเอเจนต์
บทนำ: บทเรียนนี้แนะนำ เอเจนต์อัจฉริยะ (Intelligent Agent) — ระบบอัตโนมัติที่มีวงจรปิด การรับรู้-ตัดสินใจ-การกระทำ (PDA) เรานำเสนอองค์ประกอบทั้งสาม: การรับรู้ (ผ่านเซนเซอร์), การตัดสินใจ (สมองภายใน) และ การกระทำ (ผ่านแอคชูเอเตอร์) การขยายที่สำคัญคือ การใช้เครื่องมือ (Tool Use) ซึ่งเอเจนต์เรียกใช้เครื่องมือภายนอก (เช่น เครื่องค้นหา) เพื่อขยายศักยภาพให้เกินกว่าโมเดลหลักของตนเอง ผลลัพธ์การเรียนรู้:
- นิยามเอเจนต์อัจฉริยะ และแยกแยะจากโมเดลปัญญาประดิษฐ์เชิงสร้างสรรค์ที่คงที่ ตามความสามารถในการโต้ตอบกับสภาพแวดล้อม
- วาดแผนภาพและอธิบายบทบาทของแต่ละองค์ประกอบในวงจรปิดการรับรู้-ตัดสินใจ-การกระทำ (PDA)
- ระบุและยกตัวอย่างเซนเซอร์ (การรับรู้) และแอคชูเอเตอร์ (การกระทำ) ในทั้งเอเจนต์ในโลกจริงและเอเจนต์ดิจิทัล
- เข้าใจบทบาทและความสำคัญของการ "ใช้เครื่องมือ" ในการขยายศักยภาพที่แท้จริงของเอเจนต์ให้เกินกว่าโมเดลหลัก
🔹 บทเรียนที่ 8: อำนาจแห่งการวิวัฒนาการ (คุณสมบัติของมหาวิทยาลัยโพลีเทคนิคฮ่องกง)
บทนำ: บทเรียนนี้แนะนำ การคำนวณวิวัฒนาการ (Evolutionary Computation - EC) ซึ่งเป็นแนวทางการปรับแต่งที่ได้แรงบันดาลใจจากกระบวนการเลือกธรรมชาติ ใช้หาคำตอบที่เหมาะสมที่สุดสำหรับการตัดสินใจของเอเจนต์ เราจำกัด จีโนไทป์ (Genotype) (คำสั่งที่เข้ารหัส) และ เฟโนไทป์ (Phenotype) (พฤติกรรมที่แสดงออก) การวิเคราะห์เชิงลึกเน้นสามเสาหลัก ได้แก่ การกลายพันธุ์ (Mutation) (การเปลี่ยนแปลงแบบสุ่ม), การผสมพันธุ์ (Crossover) (การรวมลักษณะ), และ การเลือก (Selection) ซึ่งถูกนำทางโดย ฟังก์ชันความเหมาะสม (Fitness Function) — ตัววัดผลที่วัดคุณภาพของคำตอบในแต่ละรุ่น ผลลัพธ์การเรียนรู้:
- นิยามการคำนวณวิวัฒนาการ (EC) และอธิบายแรงบันดาลใจจากธรรมชาติของสิ่งมีชีวิต
- แยกแยะระหว่างจีโนไทป์ (พารามิเตอร์) และเฟโนไทป์ (พฤติกรรม) ของโซลูชันที่กำลังวิวัฒนาการ
- แสดงบทบาทของ การกลายพันธุ์ การผสมพันธุ์ และการเลือกตามความเหมาะสมในอัลกอริธึมวิวัฒนาการ
- อธิบายวงจรวนซ้ำที่การคำนวณวิวัฒนาการใช้เพื่อปรับแต่งประชากรของโซลูชันในแต่ละรุ่น
- ระบุปัญหาการปรับแต่งที่อัลกอริธึมวิวัฒนาการให้ข้อได้เปรียบเหนือวิธีดั้งเดิม
🔹 บทเรียนที่ 9: การทำงานร่วมกันของหลายเอเจนต์และฝูง
บทนำ: เปลี่ยนจากปัญหาการปรับแต่งแบบเดี่ยว (บทเรียนที่ 8) บทเรียนนี้สำรวจพลวัตของความฉลาดแบบรวมกลุ่ม เราวิเคราะห์สถานการณ์ที่ต้องการความร่วมมือและการแข่งขัน โดยเน้น ความฉลาดของฝูง (Swarm Intelligence) ผู้เรียนจะได้เรียนรู้หลักการของ การเกิดขึ้นเอง (Emergence) ซึ่งพฤติกรรมระดับโลกที่ซับซ้อน (เช่น เส้นทางของมด) เกิดขึ้นได้เพียงจากโปรโตคอลสื่อสารระดับท้องถิ่นที่ง่าย สะท้อนความซับซ้อนที่เกิดขึ้นเมื่อขยายระบบอัตโนมัติ ผลลัพธ์การเรียนรู้:
- แยกแยะเป้าหมายและกลไกของระบบที่มีเอเจนต์เดียว กับระบบที่มีหลายเอเจนต์ (MAS)
- อธิบายบทบาทของการสื่อสารในการประสานความร่วมมือและการแข่งขันระหว่างเอเจนต์หลายตัว
- นิยาม "การเกิดขึ้นเอง (Emergence)" และระบุตัวอย่างความฉลาดของฝูงในโลกจริงและระบบคำนวณ (เช่น การค้นหาเส้นทางของมด)
- วิเคราะห์ว่ากฎพื้นฐานที่ง่ายและท้องถิ่นสามารถสร้างพฤติกรรมกลุ่มที่ซับซ้อนและระดับโลกได้อย่างไร
- อภิปรายเหตุผลที่ความซับซ้อนของระบบที่มีหลายเอเจนต์จำเป็นต้องมีการพิจารณาจริยธรรมและควบคุมอย่างรอบคอบ
🔹 บทเรียนที่ 10: จริยธรรม อคติ และความสัมพันธ์มนุษย์-ปัญญาประดิษฐ์
บทนำ: บทเรียนสุดท้ายนี้กล่าวถึงความรับผิดชอบทางจริยธรรมที่จำเป็นสำหรับอัตโนมัติขั้นสูง เราตรวจสอบข้อบกพร่องระบบ เช่น อคติของข้อมูล (Data Bias) และข้อจำกัดในตัวโมเดล โดยเฉพาะ การสร้างภาพเท็จของโมเดล (Model Hallucination) ความเสี่ยงจากเทคโนโลยีการสร้างขั้นสูง (วิดีโอปลอม - Deepfakes) ถูกสำรวจ นำไปสู่การแนะนำทางออก: บทบาทสำคัญของการ ควบคุมโดยมนุษย์ (Human-in-the-Loop - HITL) การสังเกตการณ์ เราจบหลักสูตรด้วยการนิยามสถานะอนาคตที่ต้องการ: ความสัมพันธ์มนุษย์-ปัญญาประดิษฐ์ (Human-AI Symbiosis) ซึ่งปัญญาประดิษฐ์ทำหน้าที่เป็นผู้ช่วยร่วมที่ทรงพลัง ช่วยเสริมศักยภาพของมนุษย์ ผลลัพธ์การเรียนรู้:
- ระบุแหล่งที่มาและผลกระทบที่เกิดจากอคติของข้อมูลและโมเดลที่สร้างภาพเท็จในระบบปัญญาประดิษฐ์สมัยใหม่
- วิเคราะห์ความเสี่ยงด้านความปลอดภัยจากเทคโนโลยีวิดีโอปลอม และความสำคัญของการยืนยันเนื้อหา
- อธิบายแนวคิดและความจำเป็นของการควบคุมโดยมนุษย์ (HITL) ในกระบวนการตัดสินใจอัตโนมัติ
- ประเมินศักยภาพของความสัมพันธ์มนุษย์-ปัญญาประดิษฐ์ โดยมองปัญญาประดิษฐ์เป็นเครื่องมือ "ผู้ช่วยร่วม" มากกว่าการแทนที่
- สร้างมุมมองเบื้องต้นเกี่ยวกับความรับผิดชอบทางจริยธรรมของผู้สร้างปัญญาประดิษฐ์ในอนาคต