Chapter 2 Cargando paquetes y datos
Los paquetes contienen funciones que nos permiten cargar archivos excel, representar datos, o hacer ciertas operaciones. R es un programa de código libre al que contribuyen sus usuarios, por lo que hay miles de paquetes a nuestra disposición.
En esta clase solo haremos uso de dos paquetes: uno para cargar un archivo excel, “readxl” y otro para representar gráficos “ggplot2”. Para ello, es necesario que primero instalemos y después activemos los paquetes paquetes.
Si los paquetes no están instalados, lo que es habitual la primera vez que se ejecuta R, deberemos instalarlos con:
# Aquellas líneas con # delante son comentarios. Ejecuta las siguientes líneas sin #.
# install.packages("readxl")
# install.packages("ggplot2")Una vez que los paquetes han sido ejecutados, podemos activarlos para avisar a R de que necesitamos cargar las funciones que emplean estos paquetes:
2.1 Cargando datos
Lo más sencillo es trabajar con directorios relativos. Esto implica colocar el archivo .r en el mismo directorio que el archivo de datos que quiere importarse. Por ejemplo, la estructura de datos que debes montar es:
📁 Mi análisis con R
|
|__ 📃 analisis.r
|
|__ 📃 datos.xlsx
Una vez la estructura de datos sea así, podemos importar el excel como:
2.2 Echando un vistazo a nuestros datos
Al ejecutar la línea anterior, el objeto “datos” debe de aparecer en nuestro entorno. Vamos a echar un vistazo y ver qué hay dentro; la función head() nos muestra las primeras filas. También podemos pulsar sobre “datos” en el entorno y se abrirá una pestaña mostrándonos su contenido.
## # A tibble: 6 × 2
## Country `GDP (current, M€)`
## <chr> <dbl>
## 1 Belgium 620272.
## 2 Bulgaria 104767.
## 3 Czechia 320786.
## 4 Denmark 392401.
## 5 Germany 4328970
## 6 Estonia 39848.
## # A tibble: 6 × 17
## age job marital education default balance housing loan contact day month duration campaign pdays previous poutcome
## <dbl> <chr> <chr> <chr> <chr> <dbl> <chr> <chr> <chr> <dbl> <chr> <dbl> <dbl> <dbl> <dbl> <chr>
## 1 30 unemploy… married primary no 1787 no no cellul… 19 oct 79 1 -1 0 unknown
## 2 33 services married secondary no 4789 yes yes cellul… 11 may 220 1 339 4 failure
## 3 35 manageme… single tertiary no 1350 yes no cellul… 16 apr 185 1 330 1 failure
## 4 30 manageme… married tertiary no 1476 yes yes unknown 3 jun 199 4 -1 0 unknown
## 5 59 blue-col… married secondary no 0 yes no unknown 5 may 226 1 -1 0 unknown
## 6 35 manageme… single tertiary no 747 no no cellul… 23 feb 141 2 176 3 failure
## # ℹ 1 more variable: y <chr>