EvoClass | Education That Evolves With You

📚 Resumen del contenido

Este curso ofrece una introducción completa e intensiva a la evolución de los Modelos de Lenguaje de Gran Tamaño (LLMs), sus arquitecturas técnicas fundamentales, paradigmas de entrenamiento (preentrenamiento, fine-tuning y alineación), extensiones multimodales, ingeniería de prompts, Cadena de Pensamiento (CoT), agentes, así como temas de vanguardia como la seguridad del modelo y la protección de privacidad.

Análisis profundo de la evolución tecnológica y la alineación de seguridad en modelos de gran tamaño de todo el stack, desde el preentrenamiento hasta agentes generales.

🎯 Objetivos de aprendizaje

Distinguir entre arquitecturas de modelos: Identificar las diferencias estructurales y casos de uso para modelos Encoder-only, Decoder-only y Encoder-Decoder.
Explicar el pipeline de entrenamiento de LLMs: Describir la transición desde el preentrenamiento autónomo hasta el Fine-Tuning Supervisado (SFT) y el Aprendizaje por Refuerzo a partir de Retroalimentación Humana (RLHF).
Analizar la escalabilidad y el comportamiento del modelo: Explicar los conceptos de Leyes de Escalabilidad, Habilidades Emergentes (aprendizaje in-context, Cadena de Pensamiento) y el fenómeno de las Alucinaciones.
Analizar las diferencias estructurales entre arquitecturas Encoder-only (BERT), Decoder-only (GPT) y Encoder-Decoder (T5).
Explicar el proceso de entrenamiento en tres etapas: Preentrenamiento (modelo base), Tuning de Instrucciones (SFT) y Alineación (RLHF/PPO).
Comparar el rendimiento, leyes de escalabilidad y innovaciones arquitectónicas de los principales LLMs como GPT, Llama, Qwen y DeepSeek.
Implementar estrategias de prompting cero-shot y few-shot para extracción y clasificación de datos estructurados.
Calibrar hiperparámetros del modelo (Temperatura, Top P, Penalidades) para equilibrar salidas creativas y deterministas.
Construir prompts efectivos de Cadena de Pensamiento (CoT) utilizando métodos manuales, automáticos y cero-shot ("Pensemos paso a paso").
Analizar y comparar variantes de CoT: Diferenciar entre Autoconsistencia, Programa de Pensamiento (PoT), Árbol de Pensamiento (ToT) y Grafo de Pensamiento (GoT).

Resumen: Esta lección explora la evolución de la Inteligencia Artificial desde modelos especializados de pequeño tamaño hasta modelos de lenguaje de gran tamaño (LLMs) de propósito general. Detalla el cambio arquitectónico desde los "BERTology" basados en encoder hasta paradigmas generativos de decoder único, cubriendo la pipeline técnica crítica de preentrenamiento, tuning de instrucciones y alineación (RLHF). Además, el contenido examina familias de modelos líderes en la industria, incluyendo GPT, Llama y innovaciones nacionales como Qwen y DeepSeek.

Resultados del aprendizaje:

Distinguir entre arquitecturas de modelos: Identificar las diferencias estructurales y casos de uso para modelos Encoder-only, Decoder-only y Encoder-Decoder.
Explicar el pipeline de entrenamiento de LLMs: Describir la transición desde el preentrenamiento autónomo hasta el Fine-Tuning Supervisado (SFT) y el Aprendizaje por Refuerzo a partir de Retroalimentación Humana (RLHF).
Analizar la escalabilidad y el comportamiento del modelo: Explicar los conceptos de Leyes de Escalabilidad, Habilidades Emergentes (aprendizaje in-context, Cadena de Pensamiento) y el fenómeno de las Alucinaciones.

Profundización en Modelos de Lenguaje Grandes

Lecciones

Lesson

Descripción del curso

📚 Resumen del contenido

🎯 Objetivos de aprendizaje

Lecciones