Probabilidad y Estadística: La Ciencia de la Incertidumbre
Un curso introductorio completo a nivel universitario sobre los fundamentos matemáticos de la probabilidad y la estadística. Requiere un año de cálculo; el curso cubre modelos de probabilidad, variables aleatorias, esperanza, distribuciones muestrales, verosimilitud e inferencia bayesiana, y relaciones entre variables.
Descripción del curso
📚 Resumen del Contenido
Un curso universitario completo e introductorio sobre los fundamentos matemáticos de la probabilidad y la estadística. Requiere un año de cálculo, y el curso abarca modelos de probabilidad, variables aleatorias, esperanza, distribuciones muestrales, verosimilitud e inferencia bayesiana, y relaciones entre variables.
Domina la rigurosa ciencia matemática de la incertidumbre mediante probabilidad basada en cálculo e inferencia estadística.
Autor: Michael J. Evans y Jeffrey S. Rosenthal
Agradecimientos: Los autores agradecen las contribuciones de diversos revisores y colegas de instituciones como la Universidad de Toronto, la Universidad McMaster y la Universidad Purdue. También se menciona el apoyo financiero y de infraestructura proporcionado por la Universidad de Toronto.
🎯 Objetivos de Aprendizaje
- Definir un modelo de probabilidad formal utilizando espacios muestrales, eventos y medidas de probabilidad.
- Aplicar principios combinatorios (permutaciones, subconjuntos, coeficientes binomiales) para resolver problemas de probabilidad uniforme.
- Utilizar la Ley de la Probabilidad Total y el Teorema de Bayes para analizar sistemas de múltiples etapas y actualizar creencias con base en nueva información.
- Definir y distinguir entre variables aleatorias discretas y absolutamente continuas y sus respectivas funciones de probabilidad/densidad.
- Identificar y aplicar distribuciones de probabilidad clave (Bernoulli, Binomial, Poisson, Normal, etc.) para modelar fenómenos del mundo real.
- Calcular densidades marginales, distribuciones condicionales y evaluar la independencia para distribuciones multivariadas.
- Calcular el valor esperado, varianza y covarianza para variables aleatorias discretas, continuas y mixtas.
- Aplicar la Ley del Estadístico Inconsciente (LOTUS) y las propiedades de linealidad para calcular esperanzas de variables transformadas.
- Derivar momentos usando Funciones Generadoras de Probabilidad (PGF) y Funciones Generadoras de Momentos (MGF).
- Definir y derivar distribuciones muestrales para funciones de secuencias i.i.d.
🔹 Lección 1: Fundamentos de los Modelos de Probabilidad
Resumen: Esta lección establece el marco matemático riguroso de la probabilidad, pasando de la intuición de "medida de incertidumbre" hacia modelos axiomáticos formales. Cubre las propiedades esenciales de las medidas de probabilidad, técnicas combinatorias de conteo para espacios finitos y los mecanismos fundamentales de la probabilidad condicional, incluyendo el Teorema de Bayes y la continuidad de las medidas de probabilidad.
Resultados de Aprendizaje:
- Definir un modelo de probabilidad formal usando espacios muestrales, eventos y medidas de probabilidad.
- Aplicar principios combinatorios (permutaciones, subconjuntos, coeficientes binomiales) para resolver problemas de probabilidad uniforme.
- Utilizar la Ley de la Probabilidad Total y el Teorema de Bayes para analizar sistemas de múltiples etapas y actualizar creencias con base en nueva información.
🔹 Lección 2: Variables Aleatorias y Distribuciones de Probabilidad
Resumen: Esta lección explora el marco matemático para cuantificar la incertidumbre mediante variables aleatorias (VA). Los estudiantes avanzarán desde la definición de VA y sus distribuciones (discretas y continuas) hasta comprender distribuciones conjuntas, transformaciones y los métodos utilizados para simular estas variables numéricamente. El contenido pone de relieve la conexión entre la probabilidad basada en cálculo y las aplicaciones prácticas en modelado y simulación estadística.
Resultados de Aprendizaje:
- Definir y distinguir entre variables aleatorias discretas y absolutamente continuas y sus respectivas funciones de probabilidad/densidad.
- Identificar y aplicar distribuciones de probabilidad clave (Bernoulli, Binomial, Poisson, Normal, etc.) para modelar fenómenos del mundo real.
- Calcular densidades marginales, distribuciones condicionales y evaluar la independencia para distribuciones multivariadas.
🔹 Lección 3: Esperanza Matemática y Momentos
Resumen: Esta lección explora el concepto fundamental de esperanza matemática como el "promedio a largo plazo" de una variable aleatoria, extendiéndose desde casos simples discretos y continuos hasta variables arbitrarias generales. Analizaremos la variabilidad de los datos a través de la varianza y la covarianza, utilizaremos funciones generadoras (PGF, MGF y Funciones Características) para simplificar cálculos de momentos y aplicaremos desigualdades probabilísticas poderosas para acotar distribuciones desconocidas. Finalmente, el curso cubre expectativas condicionales y la Ley de la Esperanza Total, que son esenciales para analizar procesos aleatorios complejos de múltiples etapas.
Resultados de Aprendizaje:
- Calcular el valor esperado, varianza y covarianza para variables aleatorias discretas, continuas y mixtas.
- Aplicar la Ley del Estadístico Inconsciente (LOTUS) y las propiedades de linealidad para calcular esperanzas de variables transformadas.
- Derivar momentos usando Funciones Generadoras de Probabilidad (PGF) y Funciones Generadoras de Momentos (MGF).
🔹 Lección 4: Distribuciones Muestrales y Teoremas Límite
Resumen: Esta lección explora el comportamiento de variables aleatorias cuando son funciones de una muestra (distribuciones muestrales) y cómo se comportan estas distribuciones conforme crece el tamaño de la muestra (teoremas límite). Los estudiantes dominarán la transición de distribuciones de muestras finitas a aproximaciones asintóticas como el Teorema del Límite Central e investigarán métodos computacionales como aproximaciones de Monte Carlo y Muestreo de Importancia.
Resultados de Aprendizaje:
- Definir y derivar distribuciones muestrales para funciones de secuencias i.i.d.
- Distinguir entre y aplicar Convergencia en Probabilidad y Convergencia en Distribución.
- Utilizar el Teorema del Límite Central y la Aproximación Normal a la Binomial para estimar probabilidades.
🔹 Lección 5: Fundamentos de la Inferencia Estadística
Resumen: Esta lección explora la transición de la probabilidad pura hacia la inferencia estadística, abordando cómo usamos datos observados para hacer afirmaciones sobre las verdaderas medidas de probabilidad subyacentes de un sistema. Los estudiantes aprenderán a construir modelos estadísticos formales (Bernoulli y Normal), comprender métodos rigurosos de recolección de datos como muestreo aleatorio simple y estratificado en poblaciones finitas, y resumir hallazgos mediante estadísticas descriptivas, histogramas y funciones empíricas de distribución.
Resultados de Aprendizaje:
- Definir el papel de la inferencia estadística al abordar la incertidumbre causada por variabilidad y datos limitados.
- Construir e interpretar modelos estadísticos, identificando parámetros y espacios de parámetros.
- Diferenciar entre características de población y estimaciones de muestra usando técnicas de muestreo aleatorio simple y estratificado.
🔹 Lección 6: Inferencia Basada en Verosimilitud
Resumen: Esta lección explora los fundamentos teóricos y aplicaciones prácticas de la inferencia estadística basada en verosimilitud. Se pasa de conceptos fundamentales como el Principio de Verosimilitud y la suficiencia hacia la estimación de parámetros mediante Máxima Verosimilitud (MLE) y la evaluación de estos estimadores mediante sesgo, consistencia y errores estándar. Además, la lección cubre enfoques paramétricos (intervalos z, intervalos t y pruebas de hipótesis) y métodos libres de distribución (Método de Momentos, Bootstrapping y Estadística de Signos), culminando en el estudio avanzado de Normalidad Asintótica e Información de Fisher.
Resultados de Aprendizaje:
- Definir y aplicar la Función de Verosimilitud y el Teorema de Factorización para identificar estadísticas suficientes y mínimamente suficientes.
- Calcular estimadores de máxima verosimilitud (MLE) y evaluar su calidad usando Error Cuadrático Medio (MSE), Sesgo y Consistencia.
- Construir e interpretar Intervalos de Confianza y valores-p para diversos modelos estadísticos usando técnicas paramétricas y no paramétricas.
🔹 Lección 7: Inferencia Estadística Bayesiana
Resumen: Esta lección explora el marco bayesiano de la inferencia estadística, donde los parámetros se tratan como variables aleatorias con distribuciones de probabilidad. Los estudiantes aprenderán a combinar creencias previas (Distribuciones Previas) con datos observados (Verosimilitud) para producir creencias actualizadas (Distribuciones Posteriores). El currículo cubre fundamentos teóricos, técnicas prácticas de estimación (Factores de Bayes, Predicción), métodos computacionales (Muestreo de Gibbs, Normalidad Asintótica) y la selección estratégica de prioridades.
Resultados de Aprendizaje:
- Calcular distribuciones posteriores usando el Teorema de Bayes para diversos modelos, incluyendo familias conjugadas.
- Realizar estimación bayesiana (media, moda) y pruebas de hipótesis usando Factores de Bayes.
- Construir distribuciones predictivas posteriores para observaciones futuras.
🔹 Lección 8: Inferencias Óptimas y Teoría de Decisión
Resumen: Esta lección explora los fundamentos matemáticos para encontrar "mejores" procedimientos estadísticos. Se pasa de la estimación básica a la estimación óptima insesgada (UMVU), se desarrolla la teoría de pruebas Uniformemente Más Poderosas (UMP) a través del Teorema de Neyman-Pearson, y se integran perspectivas bayesianas y la Teoría de Decisión para evaluar estimadores y pruebas mediante funciones de pérdida y riesgo.
Resultados de Aprendizaje:
- Aplicar el Teorema de Rao-Blackwell y el Teorema de Lehmann-Scheffé para derivar estimadores UMVU (Uniformemente Mínima Varianza Insesgada).
- Utilizar la Desigualdad de Cramér-Rao para determinar el límite inferior fundamental sobre la varianza de estimadores insesgados.
- Construir pruebas Uniformemente Más Poderosas (UMP) usando el Lema de Neyman-Pearson y evaluarlas mediante funciones de potencia y tipos de error.
🔹 Lección 9: Verificación de Modelos y Diagnóstico
Resumen: Esta lección explora el proceso crítico de validar las suposiciones realizadas durante el modelado estadístico. Los estudiantes aprenderán a usar estadísticas de discrepancia y ancilares para verificar modelos de muestreo, utilizar herramientas visuales como gráficos de residuos y gráficos de probabilidad, y realizar pruebas formales como la prueba de Chi-Cuadrado y la prueba exacta de Fisher. Además, la lección cubre la verificación bayesiana de modelos mediante análisis de conflicto entre priori y datos y advierte contra los peligros estadísticos de realizar múltiples comprobaciones simultáneas.
Resultados de Aprendizaje:
- Definir e identificar Estadísticas Ancilares y Estadísticas de Discrepancia utilizadas para medir desviaciones del modelo.
- Construir e interpretar Residuos Estandarizados y Gráficos de Probabilidad Normal para evaluar normalidad y ajuste del modelo.
- Aplicar la Prueba de Bondad de Ajuste de Chi-Cuadrado y la Prueba Exacta de Fisher a datos categóricos y agrupados.
🔹 Lección 10: Relaciones entre Variables y Regresión
Resumen: Esta lección explora cómo los modelos estadísticos describen las dependencias entre diferentes variables. Avanza desde la definición fundamental de relación —basada en cambios en distribuciones condicionales— hacia técnicas de modelado sofisticadas incluyendo Regresión Lineal Simple y Múltiple, Análisis de Varianza (ANOVA) para predictores categóricos y Regresión Logística para respuestas binarias. Los estudiantes aprenderán a estimar parámetros mediante el Método de Mínimos Cuadrados, evaluar el ajuste del modelo a través de R-cuadrado y descomposición ANOVA, y validar supuestos mediante análisis de residuos.
Resultados de Aprendizaje:
- Definir e identificar relaciones entre variables basadas en distribuciones condicionales.
- Aplicar el Método de Mínimos Cuadrados para estimar parámetros en modelos de regresión lineal simple y múltiple.
- Utilizar la descomposición ANOVA y estadísticas F para probar la significancia de predictores e identificar interacciones.
🔹 Lección 11: Introducción a los Procesos Estocásticos
Resumen: Esta lección proporciona una fundación completa en procesos estocásticos —sistemas que evolucionan aleatoriamente con el tiempo. Los estudiantes pasarán de modelos de tiempo discreto, como Caminatas Aleatorias Simples y Cadenas de Markov, a técnicas computacionales avanzadas como MCMC (Monte Carlo de Cadena de Markov), y finalmente a procesos de tiempo continuo incluyendo Martingalas, Movimiento Browniano y Procesos de Poisson.
Resultados de Aprendizaje:
- Calcular probabilidades para caminatas aleatorias y determinar la probabilidad de "ruina" en modelos de juego.
- Analizar cadenas de Markov en términos de irreducibilidad, periodicidad y distribuciones estacionarias.
- Diseñar y explicar algoritmos de muestreo Metropolis-Hastings y Gibbs para distribuciones complejas.