Cursos / Charlas

Introducción a R

El uso de R para el análisis estadístico de información se ha popularizado mucho en los últimos años, debido a las ventajas que presenta con respecto a otros paquetes de procesamiento de datos:

•Es un software gratuito y de código abierto disponible para Windows, Mac, Unix y Linux, lo que implica que puede ser utilizado por usuarios de cualquier sistema operativo sin la necesidad de adquirir una licencia.
•Cuenta con más de 10.000 paquetes que cubren múltiples metodologías estadísticas de muchos campos de aplicación: biología, genética, agronomía, ciencias sociales, medicina, ingeniería, economía, data mining,
bioinformática, machine learning, etc.
•Es integrable con otros lenguajes: C, Java, Python.
•Posee una gran comunidad de usuarios online dispuestos a brindar soporte técnico.
•Produce gráficos e informes de calidad profesional, listos para publicar.
•Cualquier persona puede contribuir a la expansión de R creando nuevos paquetes.
•Permite acceder al código interno de sus funciones, para que el usuario sepa exactamente qué se está haciendo.
•Elimina la necesidad de recurrir a combinaciones de múltiples programas empleados en el proceso del análisis de datos (ejemplo común: usar Excel para guardar la base de datos, Minitab para la sección descriptiva y finalmente SPSS para la parte inferencial).
•Permite escribir, guardar y organizar de manera sencilla los scripts con las instrucciones o sentencias a ejecutar, evitando la necesidad de recordar qué pasos y opciones se eligieron para llegar a determinados resultados, problema que surge al utilizar programas con menús desplegables.
•Adhiere a los principios de la investigación reproducible.
•Estudios recientes lo señalan como el software más popular entre quienes se dedican a la ciencia de datos.

Temas a Desarrollar

​​​Introducción a R y RStudio
​​Funciones y tipos de objetos
​​Errores y búsqueda de ayuda
​​Crear un archivo de código
​​Paquetes
​​Ambiente y directorio de trabajo

​​​Preparación e importación de datos
​​Concepto de datos ordenados
​​Rutas y directorios
​​Chequeo de datos
​​Tipos de archivos: texto plano, Excel, etc.
​​Inconvenientes frecuentes

​​​Vectores
​​Operadores
​​Valores Lógicos
​​Indexación
​​Coerción

​​​Paquetes dplyr y tidyr
​​Estructura y resumen de datos
​​Crear, separar y unir columnas
​​Cambios condicionales
​​Manejo de variables cualitativas
​​Datos especiales: factores y fechas
​​Renombrar y seleccionar columnas
​​ •Filtrar filas y ordenar
​​•Tuberías en R
​​•Exportación de datos
​​•Formatos largo y ancho

​​​Resumen por grupos
​​Variables resumen
​​Tablas de frecuencia
​​Paquete janitor
​​Filtrado y creación de tablas

​​​•Introducción y ejemplos
​​•Sistemas gráficos en R
​​•Gramática de gráficos
​​•Paquete ggplot2
​​•Nociones útiles: exportación y personalización
​​•Paletas de colores en R
​​•Gráficos dinámicos e interactivos
​​•Visualización de datos financieros
​​•Paquetes quantmod, TTR y highcharter

​​​Relaciones entre conjuntos de datos
​​Tipos de fusión
​​Mutating joins
​​Filtering joins
​​Claves identificadoras

​​​Estructuras condicionales: if else
​​Estructuras iterativas: while, for
​​Familia de funciones apply
​​Lectura de múltiples archivos
​​Funciones definidas por el usuario

•Documentos RMarkdown
•Creación y estructura de RMarkdown
•Añadir tablas, imágenes e hipervínculos
•Exportación

​•Introducción a los datos georreferenciados
•Proyecciones geográficas
•Tipos de datos: vector y raster
•Exportación de mapas
•Paquete tmap
•Mapas animados e interactivos
•Paquete leaflet
•Ajuste de modelos espaciales