Chapter 2 Cargando paquetes y datos

Los paquetes contienen funciones que nos permiten cargar archivos excel, representar datos, o hacer ciertas operaciones. R es un programa de código libre al que contribuyen sus usuarios, por lo que hay miles de paquetes a nuestra disposición.

En esta clase solo haremos uso de dos paquetes: uno para cargar un archivo excel, “readxl” y otro para representar gráficos “ggplot2”. Para ello, es necesario que primero instalemos y después activemos los paquetes paquetes.

Si los paquetes no están instalados, lo que es habitual la primera vez que se ejecuta R, deberemos instalarlos con:

# Aquellas líneas con # delante son comentarios. Ejecuta las siguientes líneas sin #.
# install.packages("readxl")
# install.packages("ggplot2")

Una vez que los paquetes han sido ejecutados, podemos activarlos para avisar a R de que necesitamos cargar las funciones que emplean estos paquetes:

library(readxl)
library(ggplot2)

2.1 Cargando datos

Lo más sencillo es trabajar con directorios relativos. Esto implica colocar el archivo .r en el mismo directorio que el archivo de datos que quiere importarse. Por ejemplo, la estructura de datos que debes montar es:

📁 Mi análisis con R
|
|__ 📃 analisis.r
|
|__ 📃 datos.xlsx

Una vez la estructura de datos sea así, podemos importar el excel como:

datos_mkt <- read_excel(path = "datos_mkt.xlsx", sheet = 3)
datos_econ <- read_excel(path = "datos_econ.xlsx", sheet = 2)
# Eso es lo mismo que: 
# datos_econ <- read_excel("datos_econ.xlsx", 2)
# No hace falta que pongamos el nombre de los argumentos siempre que respetemos el orden. 

2.2 Echando un vistazo a nuestros datos

Al ejecutar la línea anterior, el objeto “datos” debe de aparecer en nuestro entorno. Vamos a echar un vistazo y ver qué hay dentro; la función head() nos muestra las primeras filas. También podemos pulsar sobre “datos” en el entorno y se abrirá una pestaña mostrándonos su contenido.

head(datos_econ)
## # A tibble: 6 × 2
##   Country  `GDP (current, M€)`
##   <chr>                  <dbl>
## 1 Belgium              620272.
## 2 Bulgaria             104767.
## 3 Czechia              320786.
## 4 Denmark              392401.
## 5 Germany             4328970 
## 6 Estonia               39848.
head(datos_mkt)
## # A tibble: 6 × 17
##     age job       marital education default balance housing loan  contact   day month duration campaign pdays previous poutcome
##   <dbl> <chr>     <chr>   <chr>     <chr>     <dbl> <chr>   <chr> <chr>   <dbl> <chr>    <dbl>    <dbl> <dbl>    <dbl> <chr>   
## 1    30 unemploy… married primary   no         1787 no      no    cellul…    19 oct         79        1    -1        0 unknown 
## 2    33 services  married secondary no         4789 yes     yes   cellul…    11 may        220        1   339        4 failure 
## 3    35 manageme… single  tertiary  no         1350 yes     no    cellul…    16 apr        185        1   330        1 failure 
## 4    30 manageme… married tertiary  no         1476 yes     yes   unknown     3 jun        199        4    -1        0 unknown 
## 5    59 blue-col… married secondary no            0 yes     no    unknown     5 may        226        1    -1        0 unknown 
## 6    35 manageme… single  tertiary  no          747 no      no    cellul…    23 feb        141        2   176        3 failure 
## # ℹ 1 more variable: y <chr>