EvoClass | Education That Evolves With You

📚 Resumo do Conteúdo

Este curso oferece uma introdução abrangente e aprofundada à evolução dos Modelos de Linguagem de Grande Porte (LLMs), arquiteturas técnicas centrais, paradigmas de treinamento (pré-treinamento, fine-tuning e alinhamento), extensões multimodais, engenharia de prompts, Chain of Thought (CoT), agentes, bem como temas de vanguarda como segurança de modelos e proteção da privacidade.

Análise aprofundada da evolução tecnológica e do alinhamento de segurança em modelos de grande porte, desde o pré-treinamento até agentes gerais.

🎯 Objetivos de Aprendizagem

Distinguir entre arquiteturas de modelos: Identificar as diferenças estruturais e casos de uso para modelos Encoder-apenas, Decoder-apenas e Encoder-Decoder.
Explicar o Pipeline de Treinamento de LLMs: Descrever a transição do pré-treinamento auto-supervisionado para Fine-Tuning Supervisionado (SFT) e Aprendizado por Reforço a partir de Feedback Humano (RLHF).
Analisar Escala e Comportamento de Modelos: Explicar os conceitos de Leis de Escala, Habilidades Emergentes (aprendizado in-context, Chain of Thought) e o fenômeno das Alucinações.
Analisar as diferenças estruturais entre arquiteturas Encoder-apenas (BERT), Decoder-apenas (GPT) e Encoder-Decoder (T5).
Explicar o processo de treinamento em três etapas: Pré-treinamento (modelo-base), Tuning de Instruções (SFT) e Alinhamento (RLHF/PPO).
Comparar o desempenho, leis de escala e inovações arquiteturais dos principais LLMs, incluindo GPT, Llama, Qwen e DeepSeek.
Implementar estratégias de prompt zero-shot e few-shot para extração e classificação de dados estruturados.
Calibrar hiperparâmetros do modelo (Temperatura, Top P, Penalidades) para equilibrar saídas criativas e determinísticas.
Construir prompts eficazes de Chain-of-Thought (CoT) usando métodos manuais, automáticos e zero-shot ("Vamos pensar passo a passo").
Analisar e comparar variantes de CoT: Diferenciar entre Self-Consistency, Program of Thought (PoT), Tree-of-Thought (ToT) e Graph-of-Thought (GoT).

Visão Geral: Esta aula explora o equilíbrio crítico entre utilidade e segurança de Modelos de Linguagem de Grande Porte (LLMs), focando nos mecanismos de ataques "jailbreak" e na implementação técnica da esteganografia. Aborda como atacantes contornam filtros de segurança usando engenharia de prompts sofisticada (ex: DAN, STAN) e como LLMs podem ser usados para comunicação oculta ao embutir dados no processo de geração de tokens. Além disso, apresenta a arquitetura e funcionalidades dos Modelos de Linguagem de Grande Porte Multimodais (MLLMs) no processamento e geração de diversos tipos de dados como imagens, áudio e vídeo.

Resultados de Aprendizagem:

Identificar e analisar padrões comuns de ataques de jailbreak, incluindo role-playing (DAN), coerção cognitiva (PUA) e métodos de canal lateral (cifra/código).
Explicar o mecanismo técnico da esteganografia em LLMs, especificamente como fluxos de bits são mapeados na distribuição de probabilidade (logits) das previsões de próximos tokens.
Classificar arquiteturas de MLLM com base em sua capacidade de perceber e gerar múltiplas modalidades (Texto, Imagem, Áudio, 3D).

Aprofundamento nos Modelos de Linguagem Grandes

Aulas

Lesson

Visão Geral do Curso

📚 Resumo do Conteúdo

🎯 Objetivos de Aprendizagem

Aulas