Fundamentos de IA Generativa em Python
Um guia abrangente para entender e implementar Inteligência Artificial Generativa e Modelos de Linguagem de Grande Escala (LLMs). Este curso cobre a transição desde os fundamentos teóricos até o desenvolvimento prático em Python, incluindo GANs, modelos de difusão, transformers, fine-tuning e implantação em produção.
Aulas
Visão Geral do Curso
📚 Resumo do Conteúdo
Um guia abrangente para compreender e implementar Inteligência Artificial Generativa e Modelos de Linguagem de Grande Porte (LLMs). Este curso aborda a transição das fundações teóricas para o desenvolvimento prático baseado em Python, incluindo GANs, modelos de difusão, transformadores, fine-tuning e implantação em produção.
Domine os princípios fundamentais e aplicações práticas dos modernos LLMs e técnicas generativas com Python.
Autor: Carlos Rodriguez
Agradecimentos: Agradecimentos especiais à esposa do autor, Jill, aos seus pais e aos revisores técnicos Morgan Boyce, Eric Rui e Samira Shaikh (autora da introdução).
🎯 Objetivos de Aprendizagem
- Diferenciar entre paradigmas clássicos (discriminativos) de aprendizado de máquina e modelos de IA generativa.
- Identificar as arquiteturas fundamentais da IA generativa, incluindo GANs, modelos de difusão e Transformers.
- Explicar o papel e a evolução dos Grandes Modelos de Linguagem (LLMs) no panorama mais amplo da inteligência artificial.
- Diferenciar os recursos únicos e os paradigmas arquiteturais de GANs, difusores e transformers.
- Analisar os avanços e limitações de cada tipo de modelo, incluindo problemas específicos como colapso de modo ou velocidade de amostragem.
- Implementar um pipeline Stable Diffusion e avaliar saídas geradas usando logit e probabilidades baseados em CLIP.
- Traçar a evolução da NLP desde métodos iniciais baseados em contagem e RNNs até Representações Distribuídas modernas e Aprendizado por Transferência.
- Explicar a mecânica técnica da Multi-head Attention (MHA), Auto-atenção, Mascaramento e Rede Feed-Forward (FFN).
- Implementar uma arquitetura completa de Transformer, incluindo tokenização de dados, codificação posicional e funções de treinamento/inferência.
- Mapear funcionalidades de prototipagem (por exemplo, Google Colab) para ambientes prontos para produção usando Docker e VS Code.
🔹 Lição 1: Fundamentos e Paradigmas da IA Generativa
Visão Geral: Esta lição estabelece a mudança fundamental dos paradigmas clássicos de aprendizado de máquina para a era da IA generativa. Explora a evolução arquitetural — desde GANs até Transformers — e apresenta os Grandes Modelos de Linguagem (LLMs) como a pedra angular do entendimento sintético e geração de conteúdo.
Resultados de Aprendizagem:
- Diferenciar entre paradigmas clássicos (discriminativos) de aprendizado de máquina e modelos de IA generativa.
- Identificar as arquiteturas fundamentais da IA generativa, incluindo GANs, modelos de difusão e Transformers.
- Explicar o papel e a evolução dos Grandes Modelos de Linguagem (LLMs) no cenário mais amplo da inteligência artificial.
🔹 Lição 2: Levantamento Arquitetural: GANs, Difusores e Transformers
Visão Geral: Esta lição oferece um levantamento abrangente dos três pilares arquiteturais principais da IA generativa: Redes Adversariais Generativas (GANs), Modelos de Difusão e Transformers. Os alunos explorarão a desconstrução técnica desses métodos, seus avanços evolutivos, limitações intrínsecas e aplicações práticas na geração e avaliação de imagens usando métricas CLIP em ambientes Jupyter/Colab.
Resultados de Aprendizagem:
- Diferenciar os recursos únicos e os paradigmas arquiteturais de GANs, difusores e transformers.
- Analisar os avanços e limitações de cada tipo de modelo, incluindo problemas específicos como colapso de modo ou velocidade de amostragem.
- Implementar um pipeline Stable Diffusion e avaliar saídas geradas usando logit e probabilidades baseados em CLIP.
🔹 Lição 3: Evolução da NLP e Arquitetura Transformer
Visão Geral: Esta lição traça a trajetória histórica do Processamento de Linguagem Natural, desde métodos estatísticos iniciais até a revolucionária arquitetura Transformer. Aborda a transição dos modelos sequenciais baseados em RNNs para mecanismos paralelizáveis de auto-atenção, detalhando os componentes específicos do Transformer original (Codificador/Decodificador) e a implementação prática de um pipeline de tradução usando PyTorch.
Resultados de Aprendizagem:
- Traçar a evolução da NLP desde métodos iniciais baseados em contagem e RNNs até Representações Distribuídas modernas e Aprendizado por Transferência.
- Explicar a mecânica técnica da Multi-head Attention (MHA), Auto-atenção, Mascaramento e Rede Feed-Forward (FFN).
- Implementar uma arquitetura completa de Transformer, incluindo tokenização de dados, codificação posicional e funções de treinamento/inferência.
🔹 Lição 4: Engenharia de Produção e Implantação Responsável de IA
Visão Geral: Esta lição aborda a transição crítica de prototipagem de aprendizado de máquina (fases experimentais) para implantações estáveis e prontas para produção. Integra princípios de engenharia de produção — como containerização com Docker e mapeamento de ambiente — com os imperativos éticos da IA Responsável, focando na mitigação de viés, transparência e benchmarking rigoroso de modelos usando métricas como pontuações CLIP e similaridade léxica.
Resultados de Aprendizagem:
- Mapear funcionalidades de prototipagem (por exemplo, Google Colab) para ambientes prontos para produção usando Docker e VS Code.
- Calcular a complexidade computacional e os requisitos de memória do modelo para determinar necessidades de hardware especializado.
- Avaliar modelos generativos usando métricas quantitativas (BLEU, ROUGE, METEOR) e alinhamento com CLIP.
🔹 Lição 5: Técnicas de Fine-Tuning e Aprendizado Eficiente em Parâmetros
Visão Geral: Esta lição aborda a transição de adaptação de modelo baseada em prompts para fine-tuning específico de tarefas. Explora o Aprendizado In-Contexto (Zero-shot e Few-shot), a Geração Aprimorada por Recuperação (RAG) e a implementação prática do Fine-Tuning Eficiente em Parâmetros (PEFT) usando Python. Os alunos aprenderão a construir um pipeline de resposta a perguntas, utilizar a classe Trainer do Hugging Face e avaliar resultados com base na perda de treinamento e similaridade semântica.
Resultados de Aprendizagem:
- Diferenciar entre Aprendizado In-Contexto (Zero/Few-shot), RAG e Fine-tuning.
- Implementar um fluxo de trabalho de fine-tuning baseado em PEFT usando AdaLoRA e a classe
Trainerdo Hugging Face. - Calcular e interpretar métricas de desempenho do modelo, incluindo perda de treinamento e pontuações de similaridade semântica.
🔹 Lição 6: Adaptação de Domínio para Grandes Modelos de Linguagem Especializados
Visão Geral: Esta lição explora a transição dos Grandes Modelos de Linguagem (LLMs) de ferramentas genéricas para especialistas dentro do domínio financeiro. Os alunos aprenderão o contexto histórico da adaptação de domínio, dominarão metodologias de treinamento fundamentais como Modelagem de Linguagem Causal (CLM) e Previsão de Frase Seguinte (NSP), e executarão um projeto prático de transferência de aprendizado usando Fine-Tuning Eficiente em Parâmetros (PEFT). O módulo conclui com técnicas rigorosas de avaliação usando métricas ROUGE e scores de classificação tradicionais (Precisão, Revocação, F1).
Resultados de Aprendizagem:
- Articular a história e a importância crítica de adaptar LLMs genéricos a domínios especializados.
- Executar um pipeline completo de transferência de aprendizado no domínio financeiro, incluindo pré-processamento e tokenização.
- Diferenciar entre metodologias de treinamento CLM e NSP.
🔹 Lição 7: Engenharia Avançada de Prompts e Implementação de Recuperação
Visão Geral: Esta lição explora a evolução da interação com Grandes Modelos de Linguagem (LLMs), passando do fine-tuning tradicional para abordagens baseadas em prompts. Detalha o uso estratégico de personagens, jogos de papéis situacionais e a implementação da Geração Aprimorada por Recuperação (RAG) usando LlamaIndex para criar respostas de IA contextualizadas, seguras e alinhadas à marca.
Resultados de Aprendizagem:
- Articular a transição do fine-tuning pesado em parâmetros para inferência eficiente baseada em prompts.
- Projetar e implementar personagens e jogos de papéis situacionais para orientar o comportamento e a distribuição da saída do modelo.
- Construir um pipeline funcional de RAG usando Python e a estrutura LlamaIndex.