กลับสู่คอร์สเรียน
MATH008 Postgraduate

การเพิ่มประสิทธิภาพแบบโค้งเว้า

หลักสูตรระดับปริญญาโทที่ครอบคลุมและละเอียดอ่อน พร้อมด้วยหนังสือเรียน เกี่ยวกับทฤษฎี แอปพลิเคชัน และอัลกอริธึมเชิงตัวเลขของปัญหาการเพิ่มประสิทธิภาพแบบโค้งเว้า (Convex Optimization) โดยเน้นการระบุและจัดรูปแบบปัญหาโค้งเว้าในวิศวกรรมและสาขาวิทยาศาสตร์

4.7
33.0h
591 ผู้เรียน
0 การถูกใจ
คณิตศาสตร์
เริ่มเรียน

ภาพรวมคอร์สเรียน

📚 สรุปเนื้อหา

หลักสูตรระดับปริญญาเอกที่ครอบคลุมและลึกซึ้งเกี่ยวกับทฤษฎี แอปพลิเคชัน และอัลกอริธึมเชิงตัวเลขของปัญหาการเพิ่มประสิทธิภาพแบบเว้า (Convex Optimization) โดยเน้นการรู้จำและตั้งรูปแบบปัญหาเว้าในวิศวกรรมและศาสตร์ต่างๆ

เรียนรู้พื้นฐานทางคณิตศาสตร์และอัลกอริธึมเชิงปฏิบัติของการเพิ่มประสิทธิภาพแบบเว้า เพื่อนำไปใช้ในงานด้านวิศวกรรมและวิทยาศาสตร์ข้อมูล

ผู้เขียน: สเตฟาน โบลด์, ไลเวิน แวนเดนเบิร์กเฮ

คำขอบคุณ: ได้รับการสนับสนุนจากองค์กรสนับสนุนการวิจัยแห่งชาติ (NSF) และจากความร่วมมือของนักศึกษาและเพื่อนร่วมงานที่มหาวิทยาลัยสแตนฟอร์ดและยูซีแอลเอ โดยเฉพาะอย่างยิ่ง อาคัดี เนมิโรฟสกี และ กิชัน บาเฮตี

🎯 เป้าหมายการเรียนรู้

  1. นิยามองค์ประกอบของปัญหาการเพิ่มประสิทธิภาพเชิงคณิตศาสตร์ ได้แก่ ฟังก์ชันเป้าหมาย ข้อจำกัด และตัวแปร
  2. แยกแยะระหว่างปัญหาการหาค่าต่ำสุดกำลังสอง (Least-squares), การโปรแกรมเชิงเส้น (Linear Programming), และการเพิ่มประสิทธิภาพแบบเว้า ตามลักษณะทางคณิตศาสตร์ของแต่ละประเภท
  3. เปรียบเทียบกลยุทธ์การเพิ่มประสิทธิภาพแบบท้องถิ่น (Local) และแบบทั่วไป (Global) และประเมินความซับซ้อนทางการคำนวณที่เกี่ยวข้องกับแต่ละแนวทาง
  4. นิยามและแยกแยะชุดเชิงเส้น (Affine sets), ชุดเว้า (Convex sets), และทรงกรวย (Cones) โดยใช้สัญลักษณ์เชิงรวมทางคณิตศาสตร์
  5. ระบุและแสดงชุดเว้ามาตรฐาน เช่น ลูกบอลยูคลิด (Euclidean balls), รูปไข่ (Ellipsoids), พหุภาค (Polyhedra), และทรงกรวยเชิงบวก-กึ่งแน่นอน (Positive semidefinite cone)
  6. ประยุกต์ใช้การดำเนินการที่คงความเว้า เช่น การตัดกัน การแปลงเชิงเส้น และฟังก์ชันพิสท์ (Perspective functions) เพื่อยืนยันคุณสมบัติของชุด
  7. ระบุและประยุกต์ใช้การดำเนินการที่คงความเว้า เช่น การรวมกันแบบจุดต่อจุดของฟังก์ชันเชิงเส้น และกฎการประกอบเวกเตอร์
  8. หาฟังก์ชันคอนจูเกตของลากรังจ์ (Lagrange conjugate) ของฟังก์ชันต่างๆ และนำไปใช้กับอสมการยัง (Young's inequality)
  9. อธิบายลักษณะของความเว้าเชิงไม่ชัดเจน (Quasiconvexity) โดยใช้เซตระดับต่ำ (Sublevel sets) และเงื่อนไขอนุพันธ์ลำดับที่หนึ่ง/สอง
  10. ตั้งรูปและเปลี่ยนรูป: แปลงปัญหาการเพิ่มประสิทธิภาพจากสถานะดิบให้อยู่ในรูปมาตรฐานแบบเว้า โดยใช้ตัวแปรเสริม (slack variables) และการกำจัดข้อจำกัด

🔹 บทเรียนที่ 1: บทนำสู่การเพิ่มประสิทธิภาพเชิงคณิตศาสตร์

บทสรุป: บทเรียนนี้แนะนำแนวคิดพื้นฐานของการเพิ่มประสิทธิภาพเชิงคณิตศาสตร์ ตั้งแต่รูปแบบปัญหาทั่วไป ไปจนถึงกลุ่มปัญหาที่สามารถแก้ได้ เช่น การหาค่าต่ำสุดกำลังสองและการโปรแกรมเชิงเส้น ย้ำถึงความแตกต่างสำคัญระหว่างการเพิ่มประสิทธิภาพแบบเว้าและไม่เว้า โดยอธิบายว่าเทคนิคแบบเว้าทำหน้าที่เป็น "จุดแบ่งน้ำ" ที่มีประสิทธิภาพ และเป็นเครื่องมือสำคัญในการจัดการกับปัญหาเชิงไม่เป็นเชิงเส้นที่ยากกว่า

ผลลัพธ์การเรียนรู้:

  • นิยามองค์ประกอบของปัญหาการเพิ่มประสิทธิภาพเชิงคณิตศาสตร์ ได้แก่ ฟังก์ชันเป้าหมาย ข้อจำกัด และตัวแปร
  • แยกแยะระหว่างปัญหาการหาค่าต่ำสุดกำลังสอง การโปรแกรมเชิงเส้น และการเพิ่มประสิทธิภาพแบบเว้า ตามคุณสมบัติทางคณิตศาสตร์ของแต่ละประเภท
  • เปรียบเทียบกลยุทธ์การเพิ่มประสิทธิภาพแบบท้องถิ่นและแบบทั่วไป และประเมินความซับซ้อนทางการคำนวณที่เกี่ยวข้องกับแต่ละแนวทาง

🔹 บทเรียนที่ 2: ทฤษฎีชุดเว้า

บทสรุป: บทเรียนนี้สำรวจเรขาคณิตพื้นฐานของการเพิ่มประสิทธิภาพ ย้ายจากโครงสร้างเชิงเส้นพื้นฐานไปสู่คุณสมบัติที่ซับซ้อนของชุดเว้าและทรงกรวย ครอบคลุมนิยามเชิงคณิตศาสตร์ของชุดเชิงเส้นและชุดเว้า ตรวจสอบเรขาคณิตเฉพาะ เช่น พหุภาคและทรงกรวยเชิงบวก-กึ่งแน่นอน และอธิบายการดำเนินการและทฤษฎีบทที่ช่วยให้นักวิจัยสามารถอธิบายและจัดการกับชุดเว้าในพื้นที่มิติสูงได้

ผลลัพธ์การเรียนรู้:

  • นิยามและแยกแยะชุดเชิงเส้น ชุดเว้า และทรงกรวย โดยใช้สัญลักษณ์เชิงรวมทางคณิตศาสตร์
  • ระบุและแสดงชุดเว้ามาตรฐาน เช่น ลูกบอลยูคลิด รูปไข่ พหุภาค และทรงกรวยเชิงบวก-กึ่งแน่นอน
  • ประยุกต์ใช้การดำเนินการที่คงความเว้า เช่น การตัดกัน การแปลงเชิงเส้น และฟังก์ชันพิสท์ เพื่อยืนยันคุณสมบัติของชุด

🔹 บทเรียนที่ 3: ฟังก์ชันเว้าและคุณสมบัติ

บทสรุป: บทเรียนนี้สำรวจการดำเนินการขั้นสูงที่คงความเว้า เช่น การรวมกันแบบจุดต่อจุด (Pointwise supremum) และกฎการประกอบเฉพาะ และนำเสนอฟังก์ชันคอนจูเกตของลากรังจ์ (Lagrange conjugate function) ขยายแนวคิดเว้าไปยังฟังก์ชันแบบเว้าเชิงไม่ชัดเจน (Quasiconvex) และฟังก์ชันแบบลอจาริธึม-เว้า (Log-concave) พร้อมทั้งพิจารณาความเว้าภายใต้ความไม่เท่ากันทั่วไป (Generalized inequalities) และคุณสมบัติเฉพาะของเมทริกซ์ เช่น ส่วนย่อยของชูร์ (Schur complement) แนวคิดเหล่านี้เป็นพื้นฐานทางคณิตศาสตร์สำหรับการระบุและตั้งรูปปัญหาการเพิ่มประสิทธิภาพที่ซับซ้อน

ผลลัพธ์การเรียนรู้:

  • ระบุและประยุกต์ใช้การดำเนินการที่คงความเว้า ได้แก่ การรวมกันแบบจุดต่อจุดของฟังก์ชันเชิงเส้น และกฎการประกอบเวกเตอร์
  • หาฟังก์ชันคอนจูเกตของลากรังจ์ของฟังก์ชันต่างๆ และนำไปใช้กับอสมการยัง
  • อธิบายลักษณะของความเว้าเชิงไม่ชัดเจนโดยใช้เซตระดับต่ำ และเงื่อนไขอนุพันธ์ลำดับที่หนึ่ง/สอง

🔹 บทเรียนที่ 4: การตั้งรูปปัญหาการเพิ่มประสิทธิภาพแบบเว้า

บทสรุป: บทเรียนนี้ครอบคลุมโครงสร้างทางรูปแบบและกระบวนการเปลี่ยนรูปปัญหาการเพิ่มประสิทธิภาพแบบเว้า ตั้งแต่รูปแบบมาตรฐานและเงื่อนไขความเหมาะสม ไปจนถึงกลุ่มปัญหาเฉพาะ เช่น การโปรแกรมเชิงเส้น (LP), การโปรแกรมกำลังสอง (QP), และการโปรแกรมเชิงเส้นเชิงบวก-กึ่งแน่นอน (SDP) นักเรียนจะได้เรียนรู้วิธีระบุจุดเหมาะสมสูงสุดทั่วไป ใช้วิธีแบ่งครึ่ง (Bisection Method) กับปัญหาแบบเว้าเชิงไม่ชัดเจน และประยุกต์ใช้การแปลงสเกลาร์ (Scalarization) กับการเพิ่มประสิทธิภาพหลายเกณฑ์

ผลลัพธ์การเรียนรู้:

  • ตั้งรูปและเปลี่ยนรูป: แปลงปัญหาการเพิ่มประสิทธิภาพจากรูปแบบดิบให้อยู่ในรูปมาตรฐานแบบเว้า โดยใช้ตัวแปรเสริมและกำจัดข้อจำกัด
  • วิเคราะห์ความเหมาะสม: ประยุกต์ใช้เกณฑ์ความเหมาะสมแบบเกรเดียนต์เพื่อกำหนดว่าจุดใดเป็นจุดเหมาะสมสูงสุดทั่วไป
  • จัดประเภทและแก้ปัญหา: แยกแยะระหว่าง LP, QP, SOCP, GP และ SDP และประยุกต์ใช้วิธีเฉพาะ เช่น วิธีแบ่งครึ่งกับฟังก์ชันเว้าเชิงไม่ชัดเจน

🔹 บทเรียนที่ 5: ทฤษฎีดูอัลลากรังจ์และเงื่อนไข KKT

บทสรุป: บทเรียนนี้สำรวจทฤษฎีพื้นฐานของดูอัลลากรังจ์ ตั้งแต่การนิยามฟังก์ชันดูอัลลากรังจ์ ไปจนถึงการตั้งรูปปัญหาดูอัล ครอบคลุมช่องว่างสำคัญระหว่างค่าต่ำสุดของปัญหาต้นฉบับและดูอัล ความหมายทางเรขาคณิตและเชิงเกมของความสัมพันธ์นี้ และเงื่อนไขคารูช-คูน-ทักเกอร์ (Karush-Kuhn-Tucker: KKT) ที่อธิบายจุดเหมาะสมที่ดีที่สุด บทเรียนนี้ยังขยายแนวคิดไปสู่การวิเคราะห์ความไว (Sensitivity analysis) และราคาเงา (Shadow prices)

ผลลัพธ์การเรียนรู้:

  • หาฟังก์ชันดูอัลลากรังจ์และตั้งรูปปัญหาดูอัลสำหรับปัญหาการเพิ่มประสิทธิภาพต่างๆ
  • ประเมินความสัมพันธ์ระหว่างปัญหาต้นฉบับและดูอัล โดยใช้ทฤษฎีความสัมพันธ์อ่อน/แข็ง และเงื่อนไขการคัดเลือกสลีเตอร์ (Slater's constraint qualification)
  • ประยุกต์ใช้เงื่อนไขความเหมาะสมของ KKT เพื่อแก้ปัญหาและตรวจสอบว่าคำตอบนั้นเหมาะสมที่สุดสำหรับปัญหาแบบเว้าและไม่เว้า

🔹 บทเรียนที่ 6: การประมาณ ฟิตข้อมูล และการเรียนรู้แบบมีการควบคุม

บทสรุป: บทเรียนนี้สำรวจพื้นฐานทางคณิตศาสตร์และแอปพลิเคชันเชิงปฏิบัติในการประมาณคำตอบของระบบสมการเชิงเส้นและการฟิตฟังก์ชันกับข้อมูล มีการครอบคลุมการประมาณตามค่าสัมประสิทธิ์ (Norm-based approximation) รวมถึงฟังก์ชันลงโทษ (Penalty functions) และการเรียนรู้แบบมีการควบคุม (Regularization) เพื่อจัดการกับจุดผิดปกติ (Outliers) และความกระจัดกระจาย (Sparsity) รวมถึงเทคนิคการเพิ่มประสิทธิภาพที่ทนทานต่อความไม่แน่นอนของข้อมูล นอกจากนี้ ยังอธิบายการฟิตฟังก์ชันภายใต้ข้อจำกัดเฉพาะ เช่น ความเว้าและความเพิ่มขึ้นอย่างต่อเนื่อง (Monotonicity)

ผลลัพธ์การเรียนรู้:

  • ตั้งรูปและแก้ปัญหาการประมาณตามค่าสัมประสิทธิ์ และตีความความแตกต่างทางเรขาคณิตและสถิติระหว่างวิธีการหาค่าต่ำสุดกำลังสอง วิธีเชบีเชฟ และวิธี L1
  • ออกแบบและนำไปใช้งานโมเดลการประมาณแบบมีการควบคุม เพื่อสร้างสมดุลระหว่างข้อผิดพลาดของผลลัพธ์ ขนาดของคำตอบ และความกระจัดกระจาย
  • สร้างกรอบการประมาณแบบทนทาน (Robust approximation framework) เพื่อคำนึงถึงความไม่แน่นอนในเมทริกซ์ข้อมูล

🔹 บทเรียนที่ 7: การประมาณค่าและการอนุมานทางสถิติ

บทสรุป: บทเรียนนี้สำรวจจุดบรรจบระหว่างการอนุมานทางสถิติและการเพิ่มประสิทธิภาพแบบเว้า โดยเน้นการตั้งรูปปัญหาการประมาณค่า ได้แก่ การประมาณค่าความน่าจะเป็นสูงสุด (Maximum Likelihood), การประมาณการแจกแจงแบบไม่พารามิเตอร์ (Nonparametric distribution estimation), และการออกแบบตัวตรวจจับที่เหมาะสม ให้อยู่ในรูปแบบของปัญหาการเพิ่มประสิทธิภาพแบบเว้า นักเรียนจะได้เรียนรู้วิธีใช้การเพิ่มประสิทธิภาพเพื่อหาพารามิเตอร์และออกแบบการทดลองที่ให้ข้อมูลมีประโยชน์

ผลลัพธ์การเรียนรู้:

  • ตั้งรูปและแก้ปัญหาการประมาณค่าความน่าจะเป็นสูงสุด (MLE) และการถดถอยโลจิสติก (Logistic Regression) เป็นปัญหาการเพิ่มประสิทธิภาพแบบเว้า
  • ออกแบบตัวตรวจจับที่เหมาะสมโดยใช้การโปรแกรมเชิงเส้น (LP) และตีความคุณสมบัติของตัวตรวจจับ (ROC)
  • ประยุกต์ใช้เทคนิคการประมาณการแบบไม่พารามิเตอร์ ได้แก่ หลักการเอนโทรปีสูงสุด (Maximum Entropy) และการลดค่าความเบี่ยงเบนของกัลล์ล์บัค-เลบเลอร์ (Kullback-Leibler divergence minimization)

🔹 บทเรียนที่ 8: ปัญหาเรขาคณิตและการจำแนกประเภท

บทสรุป: บทเรียนนี้สำรวจการประยุกต์ใช้การเพิ่มประสิทธิภาพแบบเว้ากับปัญหาเรขาคณิต ได้แก่ การโปรเจกต์จุดลงบนเซต การคำนวณระยะห่างระหว่างเซต และการกำหนดศูนย์กลางของเซต นอกจากนี้ ยังขยายหลักการเรขาคณิตไปสู่งานจริง เช่น การจำแนกประเภทเชิงเส้นและไม่เชิงเส้น การวางสถานที่โรงงานที่เหมาะสม และการวางแผนพื้นที่ (Floor planning) โดยใช้การโปรแกรมเชิงเรขาคณิต (Geometric programming)

ผลลัพธ์การเรียนรู้:

  • ตั้งรูปและแก้ปัญหาการโปรเจกต์และการคำนวณระยะห่างระหว่างชุดเว้า โดยใช้เงื่อนไข KKT และการแทนค่าดูอัล
  • ประมาณชุดเว้าที่ซับซ้อนโดยใช้รูปไข่ที่มีปริมาตรมากที่สุด (Extremal volume ellipsoids) และระบุปัจจัยประสิทธิภาพของมัน
  • คำนวณศูนย์กลางของชุดต่างๆ และนำไปประยุกต์ใช้กับการจำแนกประเภทที่ทนทาน

🔹 บทเรียนที่ 9: อัลกอริธึมการหาค่าต่ำสุดแบบไม่มีข้อจำกัด

บทสรุป: บทเรียนนี้ครอบคลุมพื้นฐานทฤษฎีและวิธีการปฏิบัติในการหาค่าต่ำสุดของฟังก์ชันเว้าโดยไม่มีข้อจำกัด โดยอธิบายวิธีลดค่า (Descent methods) ตั้งแต่การลดค่าด้วยเกรเดียนต์ (Gradient Descent) ระดับแรก ไปจนถึงวิธีนิวตัน (Newton’s Method) ระดับที่สอง บทเรียนมีเนื้อหาสำคัญเกี่ยวกับการวิเคราะห์ความเร็วในการรวมตัว (Convergence analysis) โดยเน้นความเว้าแรง (Strong convexity) และทฤษฎีการคงรูปแบบเชิงเส้น (Affine-invariant theory) ของความเป็นตนเอง-โค้ง (Self-concordance)

ผลลัพธ์การเรียนรู้:

  • นิยามความเว้าแรง และใช้ผลลัพธ์ที่ได้เพื่อหาค่าขอบบนของความไม่เหมาะสมและระยะทางไปยังจุดที่เหมาะสม
  • เปรียบเทียบและต่างกันระหว่างการลดค่าด้วยเกรเดียนต์กับการลดค่าที่ชันที่สุด (Steepest Descent) ภายใต้มาตรฐานยูคลิด ควอดราติก และ L1
  • คำนวณก้าวของนิวตัน (Newton step) และค่าลดนิวตัน (Newton decrement) และอธิบายว่าทำไมวิธีนิวตันจึงมีความคงรูปแบบเชิงเส้น

🔹 บทเรียนที่ 10: การหาค่าต่ำสุดแบบมีข้อจำกัดเชิงเส้น

บทสรุป: บทเรียนนี้สำรวจวิธีการแก้ปัญหาการเพิ่มประสิทธิภาพแบบเว้าที่มีข้อจำกัดเชิงเส้น โฟกัสที่การหาค่าและนำเอาค่าก้าวของนิวตันมาใช้ วิเคราะห์วิธีเริ่มต้นที่เป็นไปได้ (Feasible start) และไม่เป็นไปได้ (Infeasible start) และตีความค่าก้าวเหล่านี้ในกรอบทั้งแบบต้นฉบับและดูอัล โดยเน้นการประยุกต์ใช้การคำนวณอย่างมีประสิทธิภาพผ่านการกำจัดบล็อกระบบ KKT

ผลลัพธ์การเรียนรู้:

  • คำนวณและตีความค่าก้าวของนิวตันและค่าลดของปัญหาที่มีข้อจำกัดเชิงเส้น
  • แสดงความเท่าเทียมกันระหว่างวิธีนิวตันที่มีข้อจำกัดเชิงเส้น กับการกำจัดข้อจำกัดออก
  • ประยุกต์ใช้วิธีนิวตันเริ่มต้นไม่เป็นไปได้ (Infeasible Start Newton method) และอธิบายคุณสมบัติการลดลงของผลต่างระหว่างต้นฉบับและดูอัล

🔹 บทเรียนที่ 11: วิธีภายในจุด (Interior-Point Methods)

บทสรุป: บทเรียนนี้ครอบคลุมวิธีภายในจุด ซึ่งแก้ปัญหาการเพิ่มประสิทธิภาพแบบเว้าที่มีข้อจำกัดไม่เท่ากัน โดยใช้วิธีนิวตันกับลำดับของปัญหาที่มีข้อจำกัดเชิงเส้น ใจความสำคัญเกี่ยวข้องกับฟังก์ชันบาร์เรียร์แบบลอการิธึม (Logarithmic barrier functions) ซึ่งติดตามเส้นทางศูนย์กลาง (Central path) ไปสู่จุดเหมาะสม และใช้กรอบต้นฉบับ-ดูอัลเพื่อเพิ่มประสิทธิภาพและความทนทาน

ผลลัพธ์การเรียนรู้:

  • นิยามและสร้างฟังก์ชันบาร์เรียร์แบบลอการิธึม และอธิบายเส้นทางศูนย์กลางและจุดดูอัลที่เกี่ยวข้อง
  • ประยุกต์ใช้วิธีบาร์เรียร์ รวมถึงการแลกเปลี่ยนระหว่างจำนวนก้าวศูนย์กลาง (Centering steps) และจำนวนรอบภายนอก (Outer iterations)
  • ตั้งรูปและแก้ปัญหาขั้นตอนที่หนึ่ง (Phase I feasibility problems) เพื่อหาจุดเริ่มต้นที่เป็นไปได้จริง