AI024 Professional

Введение в программирование на ROCm и HIP: Практическое руководство

Практическое современное руководство по программированию на графических процессорах AMD с использованием ROCm и HIP. Охватывает полный программный стек, установку, рабочие процессы сборки, программирование ядер, управление памятью, инженерию производительности, использование библиотек, перенос кода из CUDA и практики отладки в производственной среде.

5.0

30.0h

361 учеников

0 лайки

Искусственный интеллект

Начать обучение

Уроки

Lesson

1 Lesson 1

2 Lesson 2

3 Lesson 3

4 Lesson 4

5 Lesson 5

6 Lesson 6

7 Lesson 7

8 Lesson 8

9 Lesson 9

10 Lesson 10

Обзор курса

📚 Краткое содержание

Практическое современное руководство по программированию графических процессоров AMD с использованием ROCm и HIP. Охватывает полный программный стек, установку, рабочие процессы сборки, написание ядер, управление памятью, инженерию производительности, использование библиотек, перенос кода из CUDA в HIP и практики отладки в рабочей среде.

Освойте программирование графических процессоров AMD и переносимость кода из CUDA в HIP с помощью этого технического глубокого анализа.

Автор: EvoClass

Благодарности: Официальная документация по ROCm и HIP от AMD, включая проекты, такие как ROCm, HIP и ROCm LLVM.

🎯 Цели обучения

Определите, что такое HIP и его роль в экосистеме ROCm, одной краткой фразой.
Различайте между платформой ROCm, интерфейсом HIP и библиотеками ROCm (строительными блоками).
Определите иерархические уровни архитектуры ROCm от аппаратного обеспечения до прикладных фреймворков.
Определите связь между средствами разработки HIP и платформой ROCm на разных операционных системах.
Выполните систематический процесс установки, включая проверку матрицы поддержки и настройку путей после установки.
Скомпилируйте и запустите минимальную проверочную программу для устранения распространённых проблем с драйверами и доступом к среде.
Понимайте, почему надёжная стратегия сборки необходима для согласования переносимости исходного кода с производительностью, специфичной для архитектуры.
Реализуйте переносимые вызовы ядер с использованием макроса hipLaunchKernelGGL как альтернативы синтаксису тройных угловых скобок в CUDA.
Настройте профессиональные проекты на CMake, ориентированные на конкретные архитектуры ROCm, и управляйте внешними зависимостями библиотек.
Определите анатомию ядра HIP и примените базовую формулу для индексации потоков.

Уроки

Обзор: Этот урок фокусируется на центральном элементе программирования графических процессоров — управлении памятью. Он охватывает классификацию типов памяти (обычная, фиксированная, устройственная и управляемая), последствия для производительности механизмов передачи данных, а также критическую роль моделей доступа к памяти — в частности, коалиции — для достижения максимальной производительности. Учащиеся научатся находить баланс между удобством использования управляемой памяти и явным контролем, необходимым для высокопроизводительных приложений в области вычислительных наук.

Результаты обучения:

Различайте между обычной и фиксированной хост-памятью и определяйте, когда использовать каждый тип для оптимальной скорости передачи.
Реализуйте выделение памяти на устройстве и унифицированную/управляемую память с помощью API HIP (hipMalloc, hipHostMalloc, hipMallocManaged).
Анализируйте модели доступа к памяти, чтобы обеспечить коалированный доступ и избежать узких мест производительности, таких как строительная выборка.