background-color: #272822 <br> <br> <br> <br> <br> <br> <h1 style='color:white'> <center> R para contextos humanitarios de emergencia</center></h1> ## <center><font style='color:#E495A5'>L</font><font style='color:#D89F7F'>e</font><font style='color:#BDAB66'>c</font><font style='color:#96B56C'>t</font><font style='color:#65BC8C'>u</font><font style='color:#39BEB1'>r</font><font style='color:#55B8D0'>a</font> <font style='color:#91ACE1'>d</font><font style='color:#C29DDE'>e</font> <font style='color:#DE94C8'>d</font><font style='color:#E495A5'>a</font><font style='color:#D89F7F'>t</font><font style='color:#BDAB66'>o</font><font style='color:#96B56C'>s</font></center> ### <center><font style='color:#E495A5'>V</font><font style='color:#D89F7F'>i</font><font style='color:#BDAB66'>o</font><font style='color:#96B56C'>l</font><font style='color:#65BC8C'>e</font><font style='color:#39BEB1'>t</font><font style='color:#55B8D0'>a</font> <font style='color:#91ACE1'>R</font><font style='color:#C29DDE'>o</font><font style='color:#DE94C8'>i</font><font style='color:#E495A5'>z</font><font style='color:#D89F7F'>m</font><font style='color:#BDAB66'>a</font><font style='color:#96B56C'>n</font></center> --- <div class="my-header"></div> ## Lectura de datos En general, el primer paso de nuestro flujo de trabajo es importar los datos a R Una vez importados los datos, podremos: - Modificarlos - Graficarlos - Modelarlos - Comunicar nuestros resultados Los tipos de archivos de almacenamiento de datos más comunes son: - Excel - CSV (Comma Separated Values) Tambien existen - json - XML, etc. --- <div class="my-header"></div> ## Lectura de datos CSV Import Dataset > From Text...(readr) <center><img src="img/importar-asilo.png" height="450"></center> --- <div class="my-header"></div> ## Lectura de datos CSV: Opciones 2. **Seleccionamos el archivo** deseado 3. Si es CSV, en general debe decir **Delimiter: Comma** 4. También prestar atención donde dice **First Row as Names** 5. Si hay filas que hay que saltear (que no sean los nombres), podemos usar **Skip** 6. RStudio adivina el **tipo de la columna** en base a sus primeros valores, podemos cambiar el tipo si está equivocado 6. **Importante!**: Cuando terminamos de elegir las opciones, **copiamos el código** que se encuentra en el rectángulo `Code Preview` 7. Hacer click en importar Una vez que importamos datos vamos a tener disponible un dataset del tipo `tibble` en la mesada --- <div class="my-header"></div> ## Lectura de datos: Para qué copiamos el código? Es **MUY IMPORTANTE** copiar los comandos y pegarlo en nuestro flujo de trabajo Para cuando tengamos que cambiar algo en los datos, el proceso tiene que ser automático y sin clicks. ```r library(readr) mi_dataset <- read_csv("nombre_dataset.csv") ``` `readr` es un **paquete** 🎁 (incluido en el `tidyverse`) para importar y también leer datos `read_csv` es una **función** de `readr` que nos sirve para **importar datos** en **formato csv** Por eso, primero tenemos que **cargar el paquete** `readr` para tener acceso a `read_csv`!!! --- <div class="my-header"></div> ## Lectura de datos La última línea de código que copiamos es > `View(nombre_dataset)` Ese comando sirve para visualizar las filas y columnas del dataset. También si corremos > `nombre_dataset` veremos en la consola (o justo debajo del bloque de código si es un RMarkdown) algunas pocas filas del dataset. El comando `str(nombre_dataset)` devuelve una descripción general del dataset. Algunos campos que nos devuelve el comando son: - Tipo de dato (tibble) - Tamaño ([filas x columnas]) - Nombre y tipo de las columnas, etc. Posibles tipos de columnas: texto (`character`), números (`double`, `numeric`, `integer`), fechas (`Date`, `DateTime`), lógicos (`logical`), categóricas (`factor`), etc. --- <div class="my-header"></div> ## Tu turno: Lectura de datos CSV 1. Importar el archivo "decisiones_asilo_colombia.csv" (Fuente: UNHCR) con información sobre las decisiones tomadas por Colombia frente a los pedidos de asilo recibidos provenientes de distintos países 2. Indicar qué cantidad de filas y columnas tiene --- <div class="my-header"></div> ## Lectura de datos de Excel Import Dataset > From Excel <center><img src="img/importar-haiti.png" height="450"></center> --- <div class="my-header"></div> ## Lectura de datos de Excel - Ahora el paquete utilizado es `readxl` (específico para leer archivos Excel) **Importante!** - Número de página donde se encuentra el dataset - Rango de celdas donde se encuentra --- background-color: #272822 <br> <br> <br> <br> <br> <br> # <center><font style='color:#E495A5'>D</font><font style='color:#D89F7F'>e</font><font style='color:#BDAB66'>s</font><font style='color:#96B56C'>a</font><font style='color:#65BC8C'>f</font><font style='color:#39BEB1'>í</font><font style='color:#55B8D0'>o</font> <font style='color:#91ACE1'>1</font><font style='color:#C29DDE'>:</font> <font style='color:#DE94C8'>L</font><font style='color:#E495A5'>e</font><font style='color:#D89F7F'>c</font><font style='color:#BDAB66'>t</font><font style='color:#96B56C'>u</font><font style='color:#65BC8C'>r</font><font style='color:#39BEB1'>a</font> <font style='color:#55B8D0'>d</font><font style='color:#91ACE1'>e</font> <font style='color:#C29DDE'>d</font><font style='color:#DE94C8'>a</font><font style='color:#E495A5'>t</font><font style='color:#D89F7F'>o</font><font style='color:#BDAB66'>s</font> </center> --- <div class="my-header"></div> ## DESAFÍO 1: Lectura de datos El objetivo de este desafío es que leas una archivo de datos. 1. Asegúrate de estar en el proyecto `taller_R` que has creado anteriormente. 3. Crea un archivo de RMarkdown. 2. Arma un chunk para leer los datos. Importa los datasets de las hojas `A_HOGAR` y `CODE_BOOK` del archivo `MASTER_Base_Datos_4ta_Ronda_R_Capacitacion.xlsx` que contiene los datos de la Evaluacion conjunta de necesidades ante COVID-19 (Fuente: GIFMM Colombia, Fecha: Noviembre 2020). 4. Además de poner un título informativo al archivo RMarkdown, describe los datos con tus palabras. ¿Cuál es la fuente? ¿Qué variables incluyen? ¿Cuántas observaciones tiene? ¿Qué tipo de datos tiene cada columna? --- <div class="my-header"></div> ## Escritura de datos Les presento las cheatsheets o guías rápidas (en español) ⭐ [https://rstudio.com/resources/cheatsheets/](https://rstudio.com/resources/cheatsheets/) <center><img src="img/readr-guiarapida.png" height="340"></center> Nos describen brevemente la mayoria de las posibilidades (funciones, argumentos, estructuras) que nos brinda un paquete 🎁 --- <div class="my-header"></div> ## Escritura de datos Con `readr` puedo escribir archivos csv o de texto **Tu turno:** Con la ayuda de la guías rápida de `readr` guardar la encuesta del archivo `MASTER_Base_Datos_4ta_Ronda_R_Capacitacion.xls` en un archivo csv Para escribir archivos excel puedes usar el paquete `xls` --- <div class="my-header"></div> ## Escritura de datos En este modulo aprendimos a - leer datos en R - en formato .csv - en formato .xls o .xlsx - escribir datos en R --- <div class="my-header"></div> ## Licencia y material usado Licencia: [Creative Commons Attribution-ShareAlike 4.0 International License](https://creativecommons.org/licenses/by-sa/4.0/deed.es_ES). Este material está inspirado y utiliza explicaciones de: - [R para Clima](https://eliocamp.github.io/r-clima/) de Paola Corrales y Elio Campitelli - [De excel a R](https://paocorrales.github.io/deExcelaR/index.html) de Paola Corrales y Elio Campitelli - [Master the Tidyverse](https://github.com/rstudio-education/master-the-tidyverse-instructors) de Garrett Grolemund Las diapositivas fueron creadas con el paquete `xaringan`.