Volver a los cursos
AI030 Professional

Fundamentos de IA Generativa en Python

Una guía completa para comprender e implementar inteligencia artificial generativa y modelos de lenguaje grandes (LLMs). Este curso abarca la transición desde los fundamentos teóricos hasta el desarrollo práctico basado en Python, incluyendo GANs, modelos de difusión, transformadores, fine-tuning y despliegue en producción.

4.8
21.0h
964 estudiantes
5 me gusta
Inteligencia Artificial
Comenzar a aprender

Descripción del curso

📚 Resumen del Contenido

Una guía completa para comprender e implementar Inteligencia Artificial Generativa y Modelos de Lenguaje de Gran Tamaño (LLMs). Este curso cubre la transición desde los fundamentos teóricos hasta el desarrollo práctico basado en Python, incluyendo GANs, modelos de difusión, transformadores, fine-tuning y despliegue en producción.

Domina los principios básicos y las aplicaciones prácticas de los modernos LLMs y técnicas generativas con Python.

Autor: Carlos Rodriguez

Agradecimientos: Agradecimientos especiales a la esposa del autor, Jill, a sus padres y a los revisores técnicos Morgan Boyce, Eric Rui y Samira Shaikh (autor del prólogo).

🎯 Objetivos de Aprendizaje

  1. Distinguir entre los paradigmas clásicos (discriminativos) del aprendizaje automático y los modelos de IA generativa.
  2. Identificar las arquitecturas fundamentales de la IA generativa, incluyendo GANs, modelos de difusión y transformadores.
  3. Explicar el papel y la evolución de los Modelos de Lenguaje de Gran Tamaño (LLMs) dentro del panorama más amplio de la inteligencia artificial.
  4. Distinguir las características únicas y los paradigmas arquitectónicos de GANs, difusores y transformadores.
  5. Analizar los avances y limitaciones de cada tipo de modelo, incluyendo problemas específicos como el colapso de modo o la velocidad de muestreo.
  6. Implementar una pipeline de Stable Diffusion y evaluar las salidas generadas usando logits y probabilidades basados en CLIP.
  7. Rastrear la evolución del NLP desde métodos tempranos basados en conteo y RNNs hasta representaciones distribuidas modernas y aprendizaje por transferencia.
  8. Explicar la mecánica técnica de Atención Multi-cabeza (MHA), Atención Self-attention, Máscaras y la Red Feed-Forward (FFN).
  9. Implementar una arquitectura completa de Transformador, incluyendo tokenización de datos, codificación posicional y funciones de entrenamiento/inferencia.
  10. Asociar funciones de prototipo (por ejemplo, Google Colab) con entornos listos para producción utilizando Docker y VS Code.

🔹 Lección 1: Fundamentos y Paradigmas de la IA Generativa

Resumen: Esta lección establece el cambio fundamental desde los paradigmas clásicos del aprendizaje automático hacia la era de la IA generativa. Explora la evolución arquitectónica —desde GANs hasta Transformadores— e introduce los Modelos de Lenguaje de Gran Tamaño (LLMs) como piedra angular de la comprensión sintética y la generación de contenido.

Resultados de Aprendizaje:

  • Distinguir entre los paradigmas clásicos (discriminativos) del aprendizaje automático y los modelos de IA generativa.
  • Identificar las arquitecturas fundamentales de la IA generativa, incluyendo GANs, modelos de difusión y transformadores.
  • Explicar el papel y la evolución de los Modelos de Lenguaje de Gran Tamaño (LLMs) dentro del panorama más amplio de la inteligencia artificial.

🔹 Lección 2: Revisión Arquitectónica: GANs, Difusores y Transformadores

Resumen: Esta lección ofrece una encuesta exhaustiva de las tres principales pilares arquitectónicos de la IA generativa: Redes Generativas Adversariales (GANs), Modelos de Difusión y Transformadores. Los estudiantes explorarán la descomposición técnica de estos métodos, sus avances evolutivos, limitaciones inherentes y aplicaciones prácticas en generación de imágenes y evaluación usando métricas CLIP dentro de entornos Jupyter/Colab.

Resultados de Aprendizaje:

  • Distinguir las características únicas y los paradigmas arquitectónicos de GANs, difusores y transformadores.
  • Analizar los avances y limitaciones de cada tipo de modelo, incluyendo problemas específicos como el colapso de modo o la velocidad de muestreo.
  • Implementar una pipeline de Stable Diffusion y evaluar las salidas generadas usando logits y probabilidades basados en CLIP.

🔹 Lección 3: La Evolución del NLP y la Arquitectura Transformer

Resumen: Esta lección traza la trayectoria histórica del Procesamiento del Lenguaje Natural, desde métodos estadísticos tempranos hasta la revolucionaria arquitectura Transformer. Cubre la transición de modelos secuenciales basados en RNN a mecanismos de atención auto-organizados paralelizables, detallando los componentes específicos del Transformer original (Codificador/Decodificador) y la implementación práctica de una pipeline de traducción usando PyTorch.

Resultados de Aprendizaje:

  • Rastrear la evolución del NLP desde métodos tempranos basados en conteo y RNNs hasta Representaciones Distribuidas modernas y Aprendizaje por Transferencia.
  • Explicar la mecánica técnica de Atención Multi-cabeza (MHA), Atención Self-attention, Máscaras y la Red Feed-Forward (FFN).
  • Implementar una arquitectura completa de Transformador, incluyendo tokenización de datos, codificación posicional y funciones de entrenamiento/inferencia.

🔹 Lección 4: Ingeniería de Producción y Despliegue Responsable de IA

Resumen: Esta lección aborda la transición crítica desde la prototipación de aprendizaje automático (fases experimentales) hasta despliegues estables y listos para producción. Integra principios de ingeniería de producción —como la contenedorización con Docker y el mapeo de entornos— con los imperativos éticos de la IA Responsable, centrándose en la mitigación de sesgos, la transparencia y la evaluación rigurosa del modelo usando métricas como puntajes CLIP y similitud léxica.

Resultados de Aprendizaje:

  • Asociar funciones de prototipo (por ejemplo, Google Colab) con entornos listos para producción utilizando Docker y VS Code.
  • Calcular la complejidad computacional y los requisitos de memoria del modelo para determinar necesidades de hardware especializado.
  • Evaluar modelos generativos usando métricas cuantitativas (BLEU, ROUGE, METEOR) y alineación con CLIP.

🔹 Lección 5: Técnicas de Fine-Tuning y Aprendizaje Eficiente en Parámetros

Resumen: Esta lección cubre la transición desde la adaptación de modelos basada en prompts hasta el fine-tuning específico de tareas. Explora el Aprendizaje In-Context (Zero-shot y Few-shot), la Generación Incrementada por Recuperación (RAG) y la implementación práctica del Fine-Tuning Eficiente en Parámetros (PEFT) usando Python. Los estudiantes aprenderán a crear una pipeline de preguntas y respuestas, utilizar la clase Trainer de Hugging Face y evaluar resultados usando pérdida de entrenamiento y similitud semántica.

Resultados de Aprendizaje:

  • Distinguir entre Aprendizaje In-Context (Zero/Few-shot), RAG y Fine-tuning.
  • Implementar un flujo de trabajo de fine-tuning basado en PEFT usando AdaLoRA y la clase Trainer de Hugging Face.
  • Calcular e interpretar métricas de rendimiento del modelo, incluyendo pérdida de entrenamiento y puntuaciones de similitud semántica.

🔹 Lección 6: Adaptación de Dominio para Grandes Modelos de Lenguaje Especializados

Resumen: Esta lección explora la transición de los Modelos de Lenguaje de Gran Tamaño (LLMs) desde herramientas de propósito general hasta expertos especializados en el dominio financiero. Los estudiantes aprenderán el contexto histórico de la adaptación de dominio, dominarán metodologías de entrenamiento clave como el Modelado de Lenguaje Causal (CLM) y la Predicción de Frase Siguiente (NSP), y llevarán a cabo un proyecto práctico de transferencia de aprendizaje usando Fine-Tuning Eficiente en Parámetros (PEFT). El módulo concluye con técnicas rigurosas de evaluación usando métricas ROUGE y puntuaciones de clasificación tradicionales (Precisión, Recall, F1).

Resultados de Aprendizaje:

  • Articular la historia y la importancia crítica de adaptar LLMs generales a dominios especializados.
  • Ejecutar una pipeline completa de transferencia de aprendizaje en el dominio financiero, incluyendo preprocesamiento y tokenización.
  • Diferenciar entre metodologías de entrenamiento CLM y NSP.

🔹 Lección 7: Ingeniería Avanzada de Prompts e Implementación de Recuperación

Resumen: Esta lección explora la evolución de la interacción con Modelos de Lenguaje de Gran Tamaño (LLMs), pasando desde el fine-tuning tradicional hacia enfoques basados en prompts. Detalla el uso estratégico de personalidades, roles situacionales y la implementación de Generación Incrementada por Recuperación (RAG) usando LlamaIndex para crear respuestas de IA contextuales, seguras y alineadas con la marca.

Resultados de Aprendizaje:

  • Articular la transición desde el fine-tuning pesado en parámetros hasta la inferencia eficiente basada en prompts.
  • Diseñar e implementar personalidades y roles situacionales para guiar el comportamiento y la distribución de salida del modelo.
  • Construir una pipeline funcional de RAG usando Python y el marco LlamaIndex.