EvoClass

更聰明地學習

AI024 Professional

ROCm 與 HIP 程式設計入門：實用教程

一份實用且現代的 AMD GPU 編程指南，內容涵蓋 ROCm 與 HIP。從完整的軟體堆疊、安裝流程、建構工作流、核心程式設計、記憶體管理、效能工程、函式庫使用、CUDA 遷移，到生產環境調試實務，全面解析。

5.0

30.0h

361 學習者

0 讚好

人工智能

開始學習

課程

Lesson

課程總覽

📚 內容概要

一本實用且現代化的指南，介紹如何使用 ROCm 與 HIP 進行 AMD GPU 程式設計。內容涵蓋完整的軟體堆疊、安裝流程、建置工作流程、核心程式設計、記憶體管理、效能工程、函式庫使用、CUDA 移植，以及生產環境下的除錯實務。

透過這份技術深度解析，掌握 AMD GPU 程式設計與 CUDA 到 HIP 的可移植性。

作者： EvoClass

致謝： AMD 官方 ROCm 與 HIP 文件基礎，包括 ROCm、HIP 及 ROCm LLVM 等專案。

🎯 學習目標

用一句簡潔的句子定義 HIP 及其在 ROCm 生態系統中的角色。
区分 ROCm（平台）、HIP（介面）與 ROCm 函式庫（組成元件）。
識別從硬體到應用框架之間，ROCm 架構的層級結構。
定義 HIP SDK 與不同作業系統上 ROCm 平台的關係。
執行系統性的安裝流程，包含支援矩陣驗證與安裝後路徑設定。
編譯並執行一個最小化驗證程式，以排除常見的驅動程式與環境存取問題。
理解健全的建置策略對於調和原始碼可移植性與架構特定效能的重要性。
使用 hipLaunchKernelGGL 宏來實現可移植的核心啟動，作為取代 CUDA 三重尖括號語法的替代方案。
設定針對特定 ROCm 架構的生產級 CMake 專案，並管理外部函式庫依賴。
解析 HIP 核心的組成結構，並套用基本的線程索引執行公式。

課程