Taller 1 de R Studio

Descargar como pdf o txt
Descargar como pdf o txt
Está en la página 1de 28

Taller R para principiantes

Instructor: Jorge Rozas Palma


Invierno 2023
Objetivos
• Estén familiarizados con el lenguaje de programación R y cuenten con
las habilidades necesarias para profundizar en este lenguaje.

• Manejen herramientas de visualización en R.

• Aprendan buenas prácticas de escritura básica de código en R.


Organización
• La capacitación de nivel básico se compone de 5 sesiones.

• Las sesiones de realizarán los días 12,13 y 18,19 y 20 de julio.

• Haremos una pausa de 15 minutos durante la sesión.

• Asistencia mínima del 80%.

• Si van surgiendo dudas, pueden consultar durante la clase levantando la


mano ✋.
Temario
Sesión 1. Introducción y herramientas de exploración de datos

- Introducción y herramientas de exploración de datos


- ¿Qué es R y por qué usarlo? - La interfaz de R Studio - Tipos de datos
y operaciones básicas
- Exploración y manipulación básica de un data frame
Temario
Sesión 2. Procesamiento de bases de datos (1)

- Importación de datos desde distintos formatos a R


- Introducción a dplyr
- Manipulación básica de columnas (select(), rename())
- Manipulación básica de filas (arrange(), filter())
- Herramientas básicas de edición de datos (if_else())
Temario
Sesión 3. Procesamiento de bases de datos (2)

- Herramientas básicas de edición de datos (mutate())


- Funciones de agrupación (group_by(), summarise())
- Tidy data (pivor_longer(), pivot_wider())
Temario
Sesión 4. Procesamiento de bases de datos (3)

- Unión de bases de datos (joins, binds)


- Manejo de variables de tiempo (fechas)
Temario
Sesión 5. Visualización de datos usando el paquete ggplot2

- Visualizar para comunicar efectivamente


- La gramática de los gráficos: visualizar datos con ggplot2
Temario
Sesión 6 – En camino a la reproducibilidad

- Introducción a Rmarkdown
- Instalación
- ¿Qué es RMarkdown?
- Creando mi primer reporte con Rmarkdown

Ojalá llegar acá!!


Introducción
- R es gratis, su código es abierto y se encuentra disponible en la
mayoría de las plataformas (Windows, Mac OS, Linux)

- Es utilizado para abordar problemas de distintas disciplinas, sobre


todo de estadística y manipulación de datos

- Es un lenguaje para el análisis de datos


Interfaz de R
Primeros pasos en R
Primeros pasos en R
Tipos de datos
Vectores
Es el objeto más básico en R.
Un vector es una forma de almacenar datos que permite contener una
serie de valores del mismo tipo.
Veamos algunos ejemplos.

La función "c" (combine) permite unir valores u objetos.


¿cuántos elementos contiene el vector "a"?
¿De qué tipo son los vectores creados?

(con la función length() pueden contar los elementos de un vector)


Tipos de datos
Podemos encontrar 5 tipos de vectores:

Podemos consultar cuál es el tipo de vector con class() o typeof()


Tipos de datos
Creando vectores Vimos que es posible crear vectores con la función "c".

Una secuencia sencilla también podemos crearla de la siguiente manera.


Tipos de datos
Creando vectores
Sin embargo, existen funciones más poderosas para crear vectores.
Una de ellas es seq()(sequence generation).
Recibe 4 argumentos: from, to, length y by.

¿Cómo crearían un vector que vaya del 1 al 5 y que avance en intervalos


de 0.5?

Quedamos hasta aquí – 12-07-2023


Tipos de datos
Operaciones matemáticas
Tipos de datos
Indexación

En general, cuando trabajamos con datos ordenados nos interesa


seleccionar uno o algunos elementos en particular.

Al imprimir el vector bandas vemos que aparece un número entre [ ]


Tipos de datos
Indexación

¿A quién corresponde la posición 5 del vector?

La indexación es la selección de subconjuntos de datos de un vector.


[] es un operador de selección.
Tenemos diferentes alternativas para indicar posición. Veamos ejemplos:

Con un operador lógico


Tipos de datos
Tipos de datos

Ejemplo
1. Crea un vector numérico del 1 al 30 y asígnalo a un objeto (ponle el
nombre que quieras).
2. Selecciona el valor de la quinta posición.
3. Selecciona los valores mayores a 13.
4. Crea un segundo vector que vaya del 0 al 30, pero que contenga
solo los números pares.
Operadores lógicos
Operadores lógicos
Data frames
Es el formato más común al que nos enfrentamos diariamente en hojas
de cálculo, o programas como SPSS, Stata, etc. Podemos entender un
data frame como un conjunto de vectores que tienen la misma longitud
y que conforman una tabla (i.e. toman forma rectangular).

curso <- data.frame(nombre = c("kiara", "Jorge", "Mario"), notas = c(4, 7, 6.8))


Data frames
Matrices
No pueden convivir tipos de datos diferentes dentro de una matriz.

Los números fueron transformadoa a carácter!!!


Data frames
Factores
Son usados para representar variables categóricas, ordinales o no.
Parecen vectores de caracteres y a veces se comportan de esa manera
(porque permiten guardar etiquetas), pero realmente son almacenados
como integers (enteros, que son más livianos para almacenar).
Lectura de bases de datos - tidyverse
Es una colección de paquetes disponibles en R y orientados a la
manipulación, importación, exploración y visualización de datos y que se
utiliza exhaustivamente en ciencia de datos.
El uso de Tidyverse permite facilitar el trabajo estadístico y la generación de
trabajos reproducibles.
https://www.tidyverse.org/

Funciones:
Mutate
Filter
Group_by
Select
str_replace

También podría gustarte