Kembali ke Kursus
AI024 Professional

Pengantar Pemrograman ROCm dan HIP: Tutorial Praktis

Panduan praktis dan modern tentang pemrograman GPU AMD dengan ROCm dan HIP. Mencakup seluruh tumpukan perangkat lunak, instalasi, alur kerja pembuatan, pemrograman kernel, manajemen memori, insinyur kinerja, penggunaan perpustakaan, porting CUDA, serta praktik debugging produksi.

5.0
30.0h
361 siswa
0 suka
Kecerdasan Buatan
Mulai Belajar

Gambaran Umum Kursus

📚 Ringkasan Konten

Panduan praktis dan modern tentang pemrograman GPU AMD dengan ROCm dan HIP. Meliputi seluruh tumpukan perangkat lunak, instalasi, alur pembuatan (build), pemrograman kernel, manajemen memori, rekayasa kinerja, penggunaan pustaka, porting CUDA, serta praktik debugging produksi.

Kuasai pemrograman GPU AMD dan portabilitas CUDA ke HIP melalui eksplorasi teknis mendalam ini.

Penulis: EvoClass

Ucapan Terima Kasih: Dokumentasi resmi AMD untuk ROCm dan HIP, termasuk proyek-proyek seperti ROCm, HIP, dan ROCm LLVM.

🎯 Tujuan Pembelajaran

  1. Menjelaskan HIP dan perannya dalam ekosistem ROCm dalam satu kalimat singkat dan padat.
  2. Membedakan antara ROCm (platform), HIP (antarmuka), dan pustaka ROCm (komponen dasar).
  3. Mengidentifikasi lapisan hierarkis arsitektur ROCm dari perangkat keras hingga kerangka aplikasi.
  4. Menjelaskan hubungan antara SDK HIP dan platform ROCm di berbagai sistem operasi.
  5. Melaksanakan alur instalasi yang sistematis, termasuk verifikasi matriks dukungan dan konfigurasi path pasca-instalasi.
  6. Mengompilasi dan menjalankan program verifikasi minimal untuk menangani masalah umum terkait driver dan akses lingkungan.
  7. Memahami mengapa strategi pembuatan yang kuat sangat penting untuk menyelaraskan portabilitas sumber dengan kinerja khusus arsitektur.
  8. Menerapkan pemanggilan kernel portabel menggunakan makro hipLaunchKernelGGL sebagai alternatif dari sintaks triple-angle-bracket pada CUDA.
  9. Mengonfigurasi proyek CMake tingkat produksi yang menargetkan arsitektur ROCm tertentu dan mengelola dependensi pustaka eksternal.
  10. Mendefinisikan anatomi kernel HIP dan menerapkan rumus eksekusi dasar untuk indeks thread.

Pelajaran