返回课程
AI024 Professional

ROCm与HIP编程入门:实用教程

一份实用且现代的AMD GPU编程指南,涵盖ROCm和HIP。内容包括完整的软件栈、安装流程、构建工作流、内核编程、内存管理、性能工程、库使用、CUDA迁移以及生产环境调试实践。

5.0
30.0h
361 名学生
0 点赞
人工智能
开始学习

课程概述

📚 内容概要

一本实用且现代的 AMD GPU 编程指南,涵盖 ROCm 与 HIP。内容包括完整的软件栈、安装流程、构建工作流、内核编程、内存管理、性能工程、库使用、CUDA 迁移以及生产环境下的调试实践。

通过本次技术深度解析,掌握 AMD GPU 编程与 CUDA 到 HIP 的可移植性。

作者: EvoClass

致谢: 基于 AMD 官方 ROCm 与 HIP 文档资料,包括 ROCm、HIP 及 ROCm LLVM 等项目。

🎯 学习目标

  1. 用一句简洁的话定义 HIP 及其在 ROCm 生态系统中的角色。
  2. 区分 ROCm(平台)、HIP(接口)和 ROCm 库(构建模块)之间的差异。
  3. 识别从硬件到应用框架的 ROCm 架构分层结构。
  4. 定义 HIP SDK 与不同操作系统下 ROCm 平台之间的关系。
  5. 执行系统化的安装流程,包括支持矩阵验证和安装后路径配置。
  6. 编译并运行一个最小验证程序,以排查常见的驱动与环境访问问题。
  7. 理解稳健的构建策略对于平衡源码可移植性与架构特定性能的重要性。
  8. 使用 hipLaunchKernelGGL 宏实现可移植的内核启动,作为 CUDA 三重尖括号语法的替代方案。
  9. 配置面向生产的 CMake 项目,针对特定 ROCm 架构并管理外部库依赖。
  10. 描述 HIP 内核的组成结构,并应用基本的线程索引执行公式。

课程