AI024 Professional

Giới thiệu về Lập trình ROCm và HIP: Một Bài Hướng Dẫn Thực Hành

Một hướng dẫn thực tế, hiện đại về lập trình GPU AMD với ROCm và HIP. Bao gồm toàn bộ stack phần mềm, cài đặt, quy trình xây dựng, lập trình kernel, quản lý bộ nhớ, kỹ thuật tối ưu hiệu suất, sử dụng thư viện, chuyển đổi từ CUDA và các phương pháp gỡ lỗi sản xuất.

5.0

30.0h

361 học viên

0 lượt thích

Trí tuệ nhân tạo

Bắt đầu học

Bài học

Lesson

1 Lesson 1

2 Lesson 2

3 Lesson 3

4 Lesson 4

5 Lesson 5

6 Lesson 6

7 Lesson 7

8 Lesson 8

9 Lesson 9

10 Lesson 10

Tổng quan khóa học

📚 Tóm tắt nội dung

Một hướng dẫn thực tế, hiện đại về lập trình GPU AMD với ROCm và HIP. Bao gồm toàn bộ stack phần mềm, cài đặt, quy trình xây dựng, lập trình kernel, quản lý bộ nhớ, kỹ thuật hiệu suất, sử dụng thư viện, chuyển đổi từ CUDA, và các thực hành gỡ lỗi sản xuất.

Thành thạo lập trình GPU AMD và khả năng chuyển đổi từ CUDA sang HIP qua bài phân tích chuyên sâu kỹ thuật này.

Tác giả: EvoClass

Ghi nhận: Tài liệu chính thức của AMD về ROCm và HIP, bao gồm các dự án như ROCm, HIP, và ROCm LLVM.

🎯 Mục tiêu học tập

Định nghĩa HIP và vai trò của nó trong hệ sinh thái ROCm bằng một câu ngắn gọn, súc tích.
Phân biệt giữa ROCm (nền tảng), HIP (giao diện), và các thư viện ROCm (các khối xây dựng).
Xác định các lớp phân cấp kiến trúc ROCm từ phần cứng đến các khung ứng dụng.
Định nghĩa mối quan hệ giữa SDK HIP và nền tảng ROCm trên các hệ điều hành khác nhau.
Thực hiện quy trình cài đặt có hệ thống, bao gồm kiểm tra ma trận hỗ trợ và cấu hình đường dẫn sau khi cài đặt.
Biên dịch và chạy chương trình xác minh tối thiểu để khắc phục các vấn đề phổ biến liên quan đến driver và truy cập môi trường.
Hiểu tại sao chiến lược xây dựng mạnh mẽ là thiết yếu để cân bằng tính di động nguồn mã với hiệu suất đặc thù kiến trúc.
Triển khai khởi tạo kernel có thể di chuyển bằng macro hipLaunchKernelGGL như một lựa chọn thay thế cho cú pháp dấu ngoặc ba góc của CUDA.
Cấu hình các dự án CMake cấp độ sản xuất nhắm đến các kiến trúc ROCm cụ thể và quản lý các phụ thuộc thư viện bên ngoài.
Xác định cấu tạo của một kernel HIP và áp dụng công thức thực thi cơ bản để chỉ định chỉ số luồng.