Kembali ke Kursus
AI021 Professional

Panduan Pemrograman CUDA

Sumber resmi dan komprehensif bagi para pengembang untuk belajar model pemrograman CUDA dan bagaimana menulis kode dengan kinerja tinggi yang berjalan di GPU NVIDIA. Panduan ini mencakup arsitektur platform, antarmuka pemrograman, fitur perangkat keras lanjutan, serta spesifikasi teknis.

5.0
30.0h
1762 siswa
1 suka
Kecerdasan Buatan
Mulai Belajar

Gambaran Umum Kursus

📚 Ringkasan Konten

Sumber resmi dan komprehensif bagi para pengembang untuk belajar model pemrograman CUDA dan cara menulis kode berkinerja tinggi yang dijalankan pada GPU NVIDIA. Panduan ini mencakup arsitektur platform, antarmuka pemrograman, fitur perangkat keras lanjutan, serta spesifikasi teknis.

Kuasai seni komputasi paralel dengan panduan standar industri untuk NVIDIA CUDA.

Penulis: NVIDIA Corporation

Ucapan Terima Kasih: Hak Cipta © 2007–2024 NVIDIA Corporation & afiliasi. Seluruh hak dilindungi.

🎯 Tujuan Pembelajaran

  1. Mendefinisikan peran host (CPU) dan perangkat (GPU) dalam sistem heterogen.
  2. Menjelaskan model pemrograman SIMT dan organisasi hierarkis dari thread, blok, dan grid.
  3. Membedakan antara PTX (Parallel Thread Execution) dan kode biner (cubins), serta menjelaskan bagaimana kompilasi Just-in-Time (JIT) memfasilitasi kompatibilitas.
  4. Mengembangkan dan Mengompilasi Kernel CUDA: Tulis fungsi global, konfigurasikan eksekusi dengan notasi tiga tanda panah, dan kelola alur kerja kompilasi NVCC.
  5. Mengoptimalkan Memori dan Perpindahan Data: Bedakan antara model memori Unified, Eksplisit, dan Mapped, serta implementasikan memori host yang terkunci halaman untuk transfer yang efisien.
  6. Mengelola Eksekusi Paralel: Gunakan CUDA Streams, Events, dan Cooperative Groups untuk mengelola tugas asinkron dan sinkronisasi operasi CPU-GPU.
  7. Melakukan aritmetika pointer kompleks dan mengidentifikasi bottleneck arsitektur (von Neumann vs. Harvard).
  8. Menerapkan pola eksekusi CUDA lanjutan, termasuk Peluncuran Kernel Bergantung Secara Programatik dan Transfer Memori Batch Heterogen.
  9. Menggunakan fitur khusus perangkat keras seperti Thread Scopes, Proxy Asinkron, dan Pipa untuk memaksimalkan konkurensi.
  10. Mengonfigurasi dan menyesuaikan performa Unified Memory menggunakan prefetching, petunjuk penggunaan, serta manajemen ukuran halaman.

Pelajaran