AI Magic Lab
Жесткая структура курса, объединяющая четыре основных раздела: основы ИИ, генерация больших моделей (GenAI и LLM), агенты и эволюционные вычисления (выделены как особенность ПолиУ) и этика. Логика курса последовательно проходит через восприятие и данные (уроки 1–3), когнитивные процессы и генерацию (уроки 4–6), агенты и эволюцию (уроки 7–9) и завершается этикой и будущим (урок 10).
Обзор курса
📚 Краткое содержание
«Лаборатория искусственного интеллекта» — это строгий, комплексный курс, разработанный для глубокого, последовательного понимания современного искусственного интеллекта. Программа состоит из четырёх постепенно усложняющихся модулей: базовые концепции (восприятие и данные), продвинутые генеративные возможности (познание и генерация с помощью больших языковых моделей и моделей диффузии), автономные системы (агенты и эволюционное вычисление) и этическое управление (этика и будущее). Учащиеся будут проходить путь от понимания числового представления данных до мастерства в проектировании сложных систем, завершаясь всесторонним взглядом на ответственное создание и внедрение ИИ.
Этот курс предоставляет строгое, комплексное понимание современного ИИ, охватывая основы работы с данными, методы генерации с помощью больших языковых моделей (LLM), архитектуру автономных агентов и ключевые этические вопросы, необходимые для ответственного внедрения.
🎯 Цели обучения
- Освоить основы восприятия ИИ, представления данных (тензоры) и фундаментальных задач обучения с учителем, таких как классификация.
- Понять и контролировать большие языковые модели (LLM) и генеративный ИИ, применяя концепции прогнозирования последовательности, механизм внимания и продвинутые техники инжиниринга промптов.
- Проектировать и анализировать интеллектуальные агенты, интегрируя цикл «восприятие-принятие решения-действие» с продвинутыми методами оптимизации, основанными на популяции, такими как эволюционное вычисление.
- Различать генеративный и дискриминативный ИИ и объяснять механический процесс моделей диффузии для генерации изображений по тексту.
- Оценивать этические вызовы, присущие современному ИИ (смещение данных, вымышленные результаты, поддельные видео), и предлагать стратегии для ответственного симбиоза человека и ИИ.
🔹 Урок 1: Цифровой глаз машины
Обзор: Этот фундаментальный урок исследует машинное восприятие, начиная с пикселей и модели цветов RGB. Учащиеся узнают, как сырые визуальные данные количественно выражаются и как компьютерное зрение (CV) использует выделение признаков. В центре внимания — основной механизм свертка, цифровой фильтр, применяемый для обнаружения низкоуровневых признаков, таких как края, трансформирующий изображения в структурированные числовые матрицы для последующей обработки ИИ. Результаты обучения:
- Определить роли пикселей, значений RGB и разрешения в создании цифрового изображения.
- Объяснить необходимость компьютерного зрения (CV) и выделения признаков в машинном восприятии.
- Понять свертку как «цифровой фильтр», используемый для обнаружения низкоуровневых признаков, таких как края и углы.
- Понять, что все визуальные данные в конечном итоге представляются в виде структурированных числовых матриц для обработки ИИ.
🔹 Урок 2: Блоки данных (тензоры)
Обзор: Этот важный урок переходит от сырого восприятия к структурированному математическому представлению. Мы классифицируем неструктурированные данные (текст, аудио, изображения) и знакомимся с тензором — многомерным контейнером, служащим универсальным языком для всех вычислений ИИ. Мы визуализируем, как различные типы данных представлены в виде тензоров, и определяем отношения вход/выход (I/O). Ключевым является процесс предварительной обработки (очистка, масштабирование, нормализация), который является предпосылкой для эффективного обучения моделей. Результаты обучения:
- Определить основные характеристики неструктурированных данных (текст, изображения, аудио) и объяснить, почему необходимо их преобразование.
- Математически различать вектор (1D) и тензор (многомерный контейнер).
- Объяснить, как тензоры служат универсальной структурой входа/выхода для всех нейронных сетей.
- Описать ключевые шаги и цели предварительной обработки данных (очистка и нормализация) перед обучением модели.
🔹 Урок 3: Мастер классификации
Обзор: Этот урок сосредоточен на обучении с учителем, объясняя, как ИИ использует структурированные, помеченные данные для выполнения сложных задач. Основная задача — классификация, при которой модель учится сортировать входные данные, проводя воображаемую границу принятия решений. Мы оцениваем эффективность модели с помощью точности и изучаем главную проблему — переобучение, когда модель не может обобщить свои знания на новые, ранее не виденные данные. Результаты обучения:
- Определить обучение с учителем и указать роли обучающих данных и меток.
- Объяснить цель классификации и визуализировать, как модель устанавливает границу принятия решений.
- Рассчитывать или интерпретировать производительность модели с использованием метрики точности.
- Анализировать и описывать концепцию переобучения и его негативное влияние на обобщение ИИ.
🔹 Урок 4: Прогнозирование языка и внимание
Обзор: В этом уроке делается акцент на динамической генерации последовательностей, объясняется основной механизм больших языковых моделей (LLM). Мы определяем токены и ограничения окна контекста (краткосрочная память ИИ). Процесс основан на прогнозировании последовательности (расчёт вероятности следующего токена) и механизме внимания, который динамически определяет важность каждого токена. Наконец, учащиеся узнают, как параметр температура управляет случайностью и креативностью генерируемого вывода. Результаты обучения:
- Определить токен и объяснить, как текст преобразуется в последовательности для обработки LLM.
- Проиллюстрировать функцию окна контекста и объяснить её ограничение как краткосрочной памяти ИИ.
- Описать роль механизма внимания в том, как LLM фокусируется на релевантной информации при прогнозировании.
- Объяснить прогнозирование последовательности как вероятностный процесс и проанализировать, как параметр температуры управляет креативностью и случайностью вывода модели.
🔹 Урок 5: Магия инжиниринга промптов
Обзор: Опираясь на техническую основу прогнозирования LLM, этот урок фокусируется на активном контроле вывода с помощью структурированного входа — рассматривая язык как высокий уровень кода. Мы устанавливаем основную архитектуру промпта (инструкции, контекст, формат). Рассматриваются техники задания роли (персонажа), малое количество примеров (few-shot обучение) (предоставление примеров) и цепочка рассуждений (CoT), которая повышает логическую точность, требуя пошагового мышления. Результаты обучения:
- Определить инжиниринг промптов и распознать естественный язык как новый парадигм программирования для управления LLM.
- Реализовать техники задания роли (персонажа) и малого количества примеров для изменения тона, фокуса и соблюдения конкретных форматов вывода.
- Применить технику цепочки рассуждений (CoT) для решения многошаговых задач и повышения логической точности.
- Практиковать итеративную оптимизацию промптов для систематического улучшения и ограничения вывода на основе желаемых результатов.
🔹 Урок 6: Генеративное искусство и диффузия
Обзор: Этот урок переходит от контроля над текстовым вводом (урок 5) к механическому процессу создания. Мы различаем генеративный ИИ и дискриминативный ИИ. Основное внимание уделяется модели диффузии, где каждое изображение начинается со случайного шума. Процесс включает итеративное удаление шума за сотни шагов, точно контролируемое детальным промптом для обеспечения соответствия текста изображению в латентном пространстве. Результаты обучения:
- Различать генеративные и дискриминативные модели ИИ.
- Объяснить основной принцип моделей диффузии как итеративного процесса удаления шума, начиная с случайного шума.
- Описать роль текстового промпта в достижении соответствия текста изображению.
- Определить ключевые применения моделей диффузии, такие как перенос стиля.
🔹 Урок 7: Основной цикл агента
Обзор: Этот урок знакомит с интеллектуальным агентом — автономной системой, определённой замкнутым циклом восприятие-принятие решения-действие (PDA). Мы разбираем компоненты: восприятие (через датчики), принятие решения (внутренний мозг) и действие (через исполнительные устройства). Критическим расширением является использование инструментов, при котором агент вызывает внешние средства (например, поисковые системы), чтобы расширить свои возможности за пределы базовой модели. Результаты обучения:
- Определить интеллектуального агента и отличить его от статических генеративных моделей ИИ по способности взаимодействовать с окружающей средой.
- Схематично изобразить и объяснить роль каждого компонента в замкнутом цикле восприятие-принятие решения-действие (PDA).
- Определить и привести примеры датчиков (восприятие) и исполнительных устройств (действие) как в реальных, так и в полностью цифровых агентах.
- Понять функцию и значение «использования инструментов» для расширения эффективных возможностей агента за пределы его базовой модели.
🔹 Урок 8: Сила эволюции (особенность Политеха)
Обзор: Этот урок представляет эволюционное вычисление (EC) — парадигму оптимизации, вдохновленную естественным отбором, используемую для поиска оптимальных решений агентов. Мы определяем генотип (кодированные инструкции) и фенотип (выраженное поведение). Подробно рассматриваются три краеугольных камня: мутация (случайные изменения), крестовый скрещивание (сочетание черт) и отбор, управляемый функцией приспособленности — объективным критерием измерения качества решения на протяжении поколений. Результаты обучения:
- Определить эволюционное вычисление (EC) и объяснить его вдохновение биологическим естественным отбором.
- Различать генотип (параметры) и фенотип (поведение) развивающегося решения.
- Проиллюстрировать функции мутации, кроссовера и отбора, основанного на приспособленности, в алгоритме эволюции.
- Описать итеративный цикл, посредством которого ЭВО оптимизирует популяцию решений через поколения.
- Определить задачи оптимизации, где эволюционные алгоритмы предлагают преимущество перед традиционными методами.
🔹 Урок 9: Совместная работа агентов и рои
Обзор: Переходя от индивидуальной оптимизации (урок 8), этот урок исследует динамику коллективного интеллекта. Мы анализируем сценарии, требующие сотрудничества и конкуренции, с особым вниманием к интеллекту роя. Учащиеся узнают принцип возникновения (эмерженции), когда сложные глобальные поведения (например, тропы муравьёв) возникают исключительно из простых, локальных протоколов связи, подчёркивая сложность, возникающую при масштабировании автономных систем. Результаты обучения:
- Различать цели и механизмы одиночных агентных систем и многоагентных систем (MAS).
- Объяснить роль коммуникации в координации сотрудничества и конкуренции между несколькими агентами.
- Определить «возникновение» и привести примеры реальных и вычислительных реализаций интеллекта роя (например, оптимизация колонии муравьёв).
- Проанализировать, как простые, локальные правила могут порождать сложное, глобальное поведение группы.
- Обсудить, почему сложность многоагентных систем требует тщательного этического рассмотрения и контроля.
🔹 Урок 10: Этика, предвзятость и симбиоз человека и ИИ
Обзор: Этот заключительный урок затрагивает необходимую этическую ответственность, связанную с высокой степенью автономии. Мы изучаем системные недостатки, такие как предвзятость данных и внутренние ограничения моделей, особенно иллюзии модели. Исследуются риски продвинутой генерации (поддельные видео), что приводит к введению решений: ключевая роль человека в цикле (HITL). Курс завершается определением желаемого будущего состояния: симбиоз человека и ИИ, при котором ИИ действует как мощный со-пилот, дополняя человеческие способности. Результаты обучения:
- Определить источники и последствия предвзятости данных и иллюзий модели в современных системах ИИ.
- Проанализировать риски безопасности, связанные с технологией поддельных видео, и важность проверки контента.
- Объяснить концепцию и необходимость контроля «человека в цикле (HITL)» в процессах автономного принятия решений.
- Оценить потенциал симбиоза человека и ИИ, рассматривая ИИ в первую очередь как «со-пилота», а не как заменителя.
- Сформулировать первоначальную позицию по этическим обязанностям будущих создателей ИИ.