Volver a los cursos
AI025 Professional

Sistemas RAG Prácticos: De Bases de Conocimiento a Generación Incremental de Recuperación

Estas notas de clase proporcionan una visión a nivel de sistema para construir sistemas de Generación Incremental de Recuperación (RAG) funcionales. El curso cubre todo el proceso, incluyendo la ingesta de datos, estrategias de segmentación, asignación de embeddings, almacenamiento vectorial, recuperación híbrida, reordenamiento y evaluación para aplicaciones confiables de inteligencia artificial.

5.0
15.0h
619 estudiantes
0 me gusta
Inteligencia Artificial
Comenzar a aprender

Descripción del curso

📚 Resumen del Contenido

Estas notas de clase proporcionan una visión a nivel de sistema para construir sistemas de Generación Incrementada por Recuperación (RAG) funcionales. El curso cubre todo el proceso, incluyendo la ingestión de datos, estrategias de segmentación, mapeo de embeddings, almacenamiento vectorial, recuperación híbrida, reordenamiento y evaluación para aplicaciones de inteligencia artificial confiables.

Domina el arte de construir sistemas de IA basados en evidencia mediante un enfoque integral de pipeline RAG.

Autor: EvoClass

Agradecimientos: Equipo EvoClass

🎯 Objetivos de Aprendizaje

  1. Diferenciar entre prompting, fine-tuning y RAG para seleccionar la herramienta adecuada según los requisitos comerciales específicos.
  2. Mapear el flujo de información a través de un pipeline RAG, desde la consulta del usuario hasta la generación fundamentada.
  3. Diseñar una pipeline profesional de ingestión de datos que incorpore metadatos, normalización y versionado para prevenir fallos por "datos débiles".
  4. Evaluar e implementar diversas estrategias de segmentación (de longitud fija, consciente de estructura, jerárquicas) según los requisitos específicos del dominio.
  5. Explicar los mecanismos de los embeddings y la diferencia entre similitud semántica y utilidad de la respuesta.
  6. Describir la teoría técnica de los almacenes vectoriales e índices, centrándose en las compensaciones entre velocidad de recuperación (latencia) y precisión.
  7. Diseñar un plan de recuperación multietapa para un corpus a gran escala (más de 100,000 fragmentos), incluyendo estrategias de metadatos y filtrado.
  8. Diferenciar entre los objetivos de la recuperación (recobro) y el reordenamiento (precisión/relevancia).
  9. Analizar por qué el reordenamiento es esencial para una generación efectiva de LLM y cómo interactúa con el diseño de fragmentos.
  10. Diseñar estructuras de metadatos previas que apoyen la citación automática y la recuperación sensible a versiones.

🔹 Lección 1: Fundamentos de RAG y Construcción de Base de Conocimiento

Resumen: Esta lección establece la transición de los modelos de lenguaje grandes (LLM) como motores aislados de generación hacia sistemas fundamentados que utilizan conocimiento externo. Los estudiantes aprenderán el pipeline arquitectónico de la Generación Incrementada por Recuperación (RAG), comprenderán por qué la gobernanza de datos es la columna vertebral de la calidad del modelo y descubrirán cómo diseñar un proceso de ingestión que garantice fiabilidad factual mediante metadatos y versionado.

Resultados del Aprendizaje:

  • Diferenciar entre prompting, fine-tuning y RAG para seleccionar la herramienta correcta según los requisitos comerciales específicos.
  • Mapear el flujo de información a través de un pipeline RAG, desde la consulta del usuario hasta la generación fundamentada.
  • Diseñar una pipeline profesional de ingestión de datos que incorpore metadatos, normalización y versionado para prevenir fallos por "datos débiles".

🔹 Lección 2: Transformación de Datos: Segmentación, Embeddings e Indexación

Resumen: Esta lección explora la transición crítica desde texto sin procesar hasta estructuras de datos buscables en un pipeline RAG. Cubre la selección estratégica de "unidades de recuperación" mediante diversos métodos de segmentación, la representación matemática del significado mediante embeddings y la infraestructura técnica necesaria para hacer que la búsqueda de alta dimensión sea eficiente a gran escala.

Resultados del Aprendizaje:

  • Evaluar e implementar diversas estrategias de segmentación (de longitud fija, consciente de estructura, jerárquicas) según los requisitos específicos del dominio.
  • Explicar los mecanismos de los embeddings y la diferencia entre similitud semántica y utilidad de la respuesta.
  • Describir la teoría técnica de los almacenes vectoriales e índices, centrándose en las compensaciones entre velocidad de recuperación (latencia) y precisión.

🔹 Lección 3: Optimización Avanzada de Recuperación: Búsqueda Híbrida y Reordenamiento

Resumen: Esta lección aborda la transición de la búsqueda vectorial básica hacia arquitecturas de recuperación de producción. Se enfoca en la Búsqueda Híbrida —la combinación de recuperación léxica y semántica— y en el Pipeline de Recuperación de Dos Etapas, donde se emplean reordenadores para asegurar que la evidencia más "productiva" llegue al LLM. Los estudiantes aprenderán a diseñar planes de recuperación para corpora a gran escala y comprenderán la interacción crítica entre la calidad del ranking y la precisión de la generación.

Resultados del Aprendizaje:

  • Diseñar un plan de recuperación multietapa para un corpus a gran escala (más de 100,000 fragmentos), incluyendo estrategias de metadatos y filtrado.
  • Diferenciar entre los objetivos de la recuperación (recobro) y el reordenamiento (precisión/relevancia).
  • Analizar por qué el reordenamiento es esencial para una generación efectiva de LLM y cómo interactúa con el diseño de fragmentos.

🔹 Lección 4: Confianza y Calidad: Citas, Actualización y Evaluación

Resumen: Esta lección se centra en la transición de prototipos "plausibles" hacia aplicaciones RAG confiables y listas para producción. Explora cómo el diseño de metadatos permite citas fiables y precisión temporal (actualización), y proporciona un marco de múltiples capas para evaluar tanto las etapas de recuperación como de generación, superando así demostraciones engañosas.

Resultados del Aprendizaje:

  • Diseñar estructuras de metadatos previas que apoyen la citación automática y la recuperación sensible a versiones.
  • Implementar estrategias de actualización que equilibren la recencia de documentos con su autoridad.
  • Crear conjuntos completos de pruebas y realizar análisis diagnóstico de errores para identificar fallas específicas en el pipeline.

🔹 Lección 5: De Prototipo a Producción: Integración y Síntesis del Pipeline

Resumen: Esta lección pasa de los componentes teóricos de RAG a las realidades prácticas de construir aplicaciones listas para producción. Se enfoca en integrar etapas individuales en una arquitectura coherente de extremo a extremo, donde el éxito se define por la observabilidad, el manejo efectivo de fallos y la gestión cuidadosa de las compensaciones inherentes del sistema. Los estudiantes aprenderán que un sistema funcional es aquel que prioriza la trazabilidad de evidencias y un comportamiento elegante sobre la complejidad.

Resultados del Aprendizaje:

  • Mapear una arquitectura práctica de 9 etapas para sistemas RAG.
  • Identificar y evaluar las compensaciones críticas entre rendimiento, precisión y costo.
  • Diagnosticar fallos en el pipeline rastreando errores hasta etapas arquitectónicas específicas.