Volver a los cursos
AI012 Professional

Profundización en Modelos de Lenguaje Grandes

Este curso ofrece una introducción completa e intensiva al historial de desarrollo de los modelos de lenguaje grandes (LLM), sus arquitecturas técnicas fundamentales, paradigmas de entrenamiento (preentrenamiento, fine-tuning y alineación), extensiones multimodales, ingeniería de prompts, razonamiento en cadena de pensamiento, agentes, así como temas de vanguardia como la seguridad del modelo y la protección de privacidad.

4.9
24.0h
1067 estudiantes
0 me gusta
Inteligencia Artificial
Comenzar a aprender

Descripción del curso

📚 Resumen del contenido

Este curso ofrece una introducción completa e intensiva a la evolución de los Modelos de Lenguaje de Gran Tamaño (LLMs), sus arquitecturas técnicas fundamentales, paradigmas de entrenamiento (preentrenamiento, fine-tuning y alineación), extensiones multimodales, ingeniería de prompts, Cadena de Pensamiento (CoT), agentes, así como temas de vanguardia como la seguridad del modelo y la protección de privacidad.

Análisis profundo de la evolución tecnológica y la alineación de seguridad en modelos de gran tamaño de todo el stack, desde el preentrenamiento hasta agentes generales.

🎯 Objetivos de aprendizaje

  1. Distinguir entre arquitecturas de modelos: Identificar las diferencias estructurales y casos de uso para modelos Encoder-only, Decoder-only y Encoder-Decoder.
  2. Explicar el pipeline de entrenamiento de LLMs: Describir la transición desde el preentrenamiento autónomo hasta el Fine-Tuning Supervisado (SFT) y el Aprendizaje por Refuerzo a partir de Retroalimentación Humana (RLHF).
  3. Analizar la escalabilidad y el comportamiento del modelo: Explicar los conceptos de Leyes de Escalabilidad, Habilidades Emergentes (aprendizaje in-context, Cadena de Pensamiento) y el fenómeno de las Alucinaciones.
  4. Analizar las diferencias estructurales entre arquitecturas Encoder-only (BERT), Decoder-only (GPT) y Encoder-Decoder (T5).
  5. Explicar el proceso de entrenamiento en tres etapas: Preentrenamiento (modelo base), Tuning de Instrucciones (SFT) y Alineación (RLHF/PPO).
  6. Comparar el rendimiento, leyes de escalabilidad y innovaciones arquitectónicas de los principales LLMs como GPT, Llama, Qwen y DeepSeek.
  7. Implementar estrategias de prompting cero-shot y few-shot para extracción y clasificación de datos estructurados.
  8. Calibrar hiperparámetros del modelo (Temperatura, Top P, Penalidades) para equilibrar salidas creativas y deterministas.
  9. Construir prompts efectivos de Cadena de Pensamiento (CoT) utilizando métodos manuales, automáticos y cero-shot ("Pensemos paso a paso").
  10. Analizar y comparar variantes de CoT: Diferenciar entre Autoconsistencia, Programa de Pensamiento (PoT), Árbol de Pensamiento (ToT) y Grafo de Pensamiento (GoT).

Lecciones