ROCm 및 HIP를 활용한 실용적이고 최신 기술 중심의 AMD GPU 프로그래밍 안내서입니다. 전체 소프트웨어 스택, 설치, 빌드 워크플로우, 커널 프로그래밍, 메모리 관리, 성능 엔지니어링, 라이브러리 사용, CUDA 포팅, 그리고 생산 환경에서의 디버깅 실천 방법을 다룹니다.

이 기술적 심층 분석을 통해 AMD GPU 프로그래밍과 CUDA에서 HIP로의 이식성을 완전히 마스터하세요.

저자: EvoClass

감사의 말: AMD 공식 ROCm 및 HIP 문서 기반(예: ROCm, HIP, ROCm LLVM 등)

🎯 학습 목표

HIP와 그가 ROCm 생태계 내에서 맡는 역할을 한 문장으로 정의하라.
ROCm(플랫폼), HIP(인터페이스), ROCm 라이브러리(구성 요소) 간의 차이점을 구분하라.
하드웨어부터 애플리케이션 프레임워크까지의 계층적 구조를 포함해 ROCm 아키텍처의 계층을 식별하라.
다양한 운영 체제에서 HIP SDK와 ROCm 플랫폼 간의 관계를 정의하라.
지원 매트릭스 확인 및 설치 후 경로 설정을 포함한 체계적인 설치 워크플로우를 실행하라.
일반적인 드라이버 및 환경 접근 문제를 진단하기 위한 최소한의 검증 프로그램을 컴파일하고 실행하라.
소스 코드 이식성과 아키텍처에 특화된 성능 간의 조화를 이루기 위해 견고한 빌드 전략이 필수적임을 이해하라.
CUDA의 삼중 꺾쇠 괄호 구문 대신 hipLaunchKernelGGL 매크로를 사용하여 이식 가능한 커널 시작을 구현하라.
특정 ROCm 아키텍처를 타겟으로 하고 외부 라이브러리 종속성을 관리하는 생산 수준의 CMake 프로젝트를 구성하라.
HIP 커널의 구조를 정의하고 스레드 인덱싱을 위한 기본 실행 공식을 적용하라.