Volver a los cursos
AI014 Professional

Una Introducción a la Programación en R

Este curso es una introducción completa al entorno de lenguaje R, que abarca temas fundamentales desde operaciones básicas con vectores numéricos, atributos de objetos, procesamiento de arreglos y matrices, gestión de listas y marcos de datos, hasta modelado estadístico y producción de gráficos de alta calidad. Es especialmente adecuado como texto introductorio para el análisis estadístico y la ciencia de datos.

4.9
30.0h
716 estudiantes
2 me gusta
Inteligencia Artificial
Comenzar a aprender

Descripción del curso

📚 Resumen del contenido

Este curso es una introducción completa al entorno de lenguaje R, cubriendo temas centrales que van desde operaciones básicas con vectores numéricos, atributos de objetos y manejo de arreglos/matrices hasta la gestión de listas y marcos de datos, modelado estadístico y producción de gráficos de alta calidad. Es adecuado como libro de texto introductorio para el análisis estadístico y la ciencia de datos.

Domina lo esencial del lenguaje R y abre la puerta al cálculo estadístico y la visualización de datos.

Autor: Equipo Central de Desarrollo de R

Agradecimientos: Este manual es mantenido por el Equipo Central de Desarrollo de R. La versión en chino agradece la base de la traducción al japonés proporcionada por Shigeru MASE, así como las contribuciones del equipo de traducción al chino liderado por el Dr. ZP Li, el Dr. Rui Li, entre otros.

🎯 Objetivos de aprendizaje

  1. Iniciar sesiones de R, navegar por el sistema de ayuda y aplicar reglas básicas de sintaxis (sensibilidad al caso, asignaciones y comentarios).
  2. Distinguir entre y crear vectores lógicos, vectores de caracteres, y manejar valores perdidos (NA y NaN).
  3. Utilizar cuatro métodos distintos de indexación para seleccionar, excluir o modificar subconjuntos específicos de datos.
  4. Identificar y modificar los atributos intrínsecos (modo y longitud) de los objetos de R.
  5. Utilizar las funciones class() y attr() para gestionar metadatos de objetos y estructuras de datos.
  6. Crear y manipular factores y factores ordenados para representar datos categóricos.
  7. Definir y construir arreglos y matrices utilizando vectores de dimensiones y la función array().
  8. Aplicar técnicas avanzadas de indexación, incluyendo el uso de matrices de índices para extraer o modificar elementos específicos.
  9. Realizar operaciones de álgebra lineal, incluyendo productos externos, transpuestas generalizadas e inversiones matriciales.
  10. Construir y modificar listas: crear listas con nombre y sin nombre y combinarlas usando sintaxis específica de R.

🔹 Lección 1: Introducción a R y conceptos básicos de vectores

Resumen: Esta lección presenta el entorno fundamental de R, abarcando su sintaxis básica, ejecución de comandos y sistemas de ayuda. También explora tipos especializados de vectores—lógicos, de caracteres y valores perdidos—y proporciona métodos detallados para seleccionar y modificar subconjuntos de datos mediante vectores de índice.

Resultados de aprendizaje:

  • Iniciar sesiones de R, navegar por el sistema de ayuda y aplicar reglas básicas de sintaxis (sensibilidad al caso, asignaciones y comentarios).
  • Distinguir entre y crear vectores lógicos, vectores de caracteres y manejar valores perdidos (NA y NaN).
  • Utilizar cuatro métodos distintos de indexación para seleccionar, excluir o modificar subconjuntos específicos de datos.

🔹 Lección 2: Atributos de objetos y manejo de factores

Resumen: Esta lección trata sobre las propiedades fundamentales de los objetos de R, especialmente sus atributos intrínsecos como modo y longitud, y cómo pueden consultarse o modificarse. También explora los "factores"—una estructura de datos especializada para manejar variables categóricas—y demuestra cómo utilizar la función tapply() para realizar análisis estadístico agrupado según niveles de factor.

Resultados de aprendizaje:

  • Identificar y modificar los atributos intrínsecos (modo y longitud) de los objetos de R.
  • Utilizar las funciones class() y attr() para gestionar metadatos de objetos y estructuras de datos.
  • Crear y manipular factores y factores ordenados para representar datos categóricos.

🔹 Lección 3: Arreglos, matrices y álgebra lineal

Resumen: Esta lección explora las sólidas capacidades de R para manejar datos multidimensionales mediante arreglos y matrices. Los estudiantes aprenderán a definir estructuras de datos usando vectores de dimensiones, realizar indexación compleja y ejecutar operaciones esenciales de álgebra lineal—como multiplicación de matrices, inversión y descomposiciones—cruciales para el cálculo estadístico y el análisis de datos.

Resultados de aprendizaje:

  • Definir y construir arreglos y matrices utilizando vectores de dimensiones y la función array().
  • Aplicar técnicas avanzadas de indexación, incluyendo el uso de matrices de índices para extraer o modificar elementos específicos.
  • Ejecutar operaciones de álgebra lineal, incluyendo productos externos, transpuestas generalizadas e inversiones matriciales.

🔹 Lección 4: Gestión de datos: Listas, marcos de datos e I/O

Resumen: Esta lección cubre los fundamentos para manejar estructuras de datos complejas y datos externos en R. Se enfoca en las listas—contenedores flexibles que almacenan componentes de diferentes tipos—y en lo práctico del Entrada/Salida (I/O), incluyendo la lectura de archivos externos en estructuras de lista, el acceso a conjuntos de datos incorporados de paquetes y el uso de herramientas interactivas de edición para modificar datos.

Resultados de aprendizaje:

  • Construir y modificar listas: crear listas con nombre y sin nombre y combinarlas usando sintaxis específica de R.
  • Acceso a componentes: distinguir entre y aplicar diferentes métodos de indexación ([[ ]], [ ] y $) para recuperar datos de listas.
  • Entrada de datos externos: usar la función scan() para leer datos desde archivos externos en listas o matrices estructuradas.

🔹 Lección 5: Distribuciones de probabilidad y pruebas estadísticas

Resumen: Esta lección ofrece una guía completa para manejar distribuciones de probabilidad y realizar inferencia estadística en R. Los estudiantes aprenderán a utilizar el sistema estandarizado de prefijos de R (d, p, q, r) para funciones de distribución, generar estadísticas descriptivas y evaluar visualmente los datos mediante funciones acumulativas empíricas (ecdf) y gráficos Q-Q.

Resultados de aprendizaje:

  • Dominar la nomenclatura de distribuciones de R (prefijos d, p, q, r) y aplicarla a distribuciones estándar como Normal, T y F.
  • Construir e interpretar herramientas visuales de diagnóstico, específicamente funciones acumulativas empíricas (ecdf) y gráficos cuantil-cuantil (Q-Q), para evaluar el ajuste de distribuciones.
  • Ejecutar y diferenciar pruebas paramétricas y no paramétricas, incluyendo pruebas t de Welch, pruebas de normalidad de Shapiro-Wilk y pruebas de Kolmogorov-Smirnov.

🔹 Lección 6: Control de programas y lógica iterativa

Resumen: Esta lección cubre los mecanismos fundamentales para controlar el flujo de ejecución en R. Se centra en agrupar múltiples expresiones en unidades individuales y utilizar declaraciones de control—incluyendo bifurcaciones condicionales (if-else) y diversas estructuras de bucle (for, repeat y while)—para automatizar tareas de análisis de datos y manejar lógica compleja.

Resultados de aprendizaje:

  • Agrupar múltiples expresiones de R en una sola declaración usando llaves.
  • Implementar lógica condicional para ejecutar bloques de código específicos según criterios lógicos.
  • Crear bucles iterativos para automatizar operaciones repetitivas sobre estructuras de datos como vectores y listas.

🔹 Lección 7: Desarrollo de funciones personalizadas y ámbito de variables

Resumen: Esta lección explora la transición de usar R como una calculadora interactiva hacia usarlo como un lenguaje de programación mediante el desarrollo de funciones personalizadas. Cubre la sintaxis para definir funciones, el manejo de argumentos, las reglas de ámbito léxico y los conceptos fundamentales del sistema orientado a objetos S3 de R a través de funciones genéricas y métodos.

Resultados de aprendizaje:

  • Crear e invocar funciones personalizadas: definir funciones con parámetros formales y operadores binarios personalizados.
  • Gestionar argumentos y ámbito: distinguir entre coincidencia de argumentos posicionales y por nombre, y explicar cómo el ámbito léxico gestiona variables locales y libres.
  • Implementar estado mutable y entornos personalizados: usar clausuras y el operador de asignación superior para mantener estado y personalizar el entorno de R mediante funciones de inicio/sesión.

🔹 Lección 8: Modelado estadístico: lineal y no lineal

Resumen: Esta lección explora el conjunto completo de herramientas de R para modelado estadístico más allá de la regresión lineal simple. Cubre la extracción de información de modelos mediante funciones genéricas, la comparación de modelos mediante ANOVA y el ajuste de Modelos Lineales Generalizados (GLM) para datos binarios y de recuento, junto con técnicas de modelado no lineal.

Resultados de aprendizaje:

  • Usar funciones genéricas de R para extraer, resumir y visualizar información de modelos ajustados.
  • Realizar comparaciones de modelos usando tablas ANOVA y actualizar modelos existentes con sintaxis eficiente.
  • Ajustar Modelos Lineales Generalizados (GLM) usando familias y funciones de enlace apropiadas (por ejemplo, Logit, Probit, Poisson).

🔹 Lección 9: Visualización de datos con gráficos de alto y bajo nivel

Resumen: Esta lección cubre las capacidades gráficas completas de R, distinguiendo entre funciones de trazado de alto nivel que crean gráficos completos y comandos de bajo nivel que añaden elementos específicos a visualizaciones existentes. Los estudiantes aprenderán a manipular parámetros gráficos para un control estético preciso y gestionar múltiples entornos de figuras.

Resultados de aprendizaje:

  • Distinguir entre y implementar funciones gráficas de alto nivel (por ejemplo, plot(), hist()) y de bajo nivel (por ejemplo, points(), lines()).
  • Aplicar y gestionar parámetros gráficos usando condiciones permanentes (par()) y temporales (a nivel de función).
  • Coordinar diseños complejos, incluyendo presentaciones de datos multivariados y entornos de múltiples figuras.

🔹 Lección 10: Ecosistema de paquetes y configuración del entorno

Resumen: Esta lección explora los fundamentos estructurales de R, centrándose en el ecosistema de paquetes, el papel de CRAN y el mecanismo de espacios de nombres para gestionar funciones. También proporciona una hoja de ruta práctica para ejecutar R a través de diversas interfaces y dominar la configuración del entorno mediante argumentos de línea de comandos y atajos de teclado.

Resultados de aprendizaje:

  • Entender la relación entre paquetes, espacios de nombres y el sistema de repositorio CRAN.
  • Ejecutar una sesión completa de "ejemplo" que involucre manipulación de datos, modelado estadístico y trazado matemático complejo.
  • Configurar el entorno de inicio de R usando banderas de línea de comandos y variables de entorno.