Tunala Marilyn Act1 Procesado
Tunala Marilyn Act1 Procesado
Tunala Marilyn Act1 Procesado
1
Actividades
Asignatura Datos del alumno Fecha
Ingeniería para el Apellidos: Tunala Llumiugsi
Procesado Masivo de 10-07-2022
Datos Nombre: Marilyn Anabel
2
Actividades
Asignatura Datos del alumno Fecha
Ingeniería para el Apellidos: Tunala Llumiugsi
Procesado Masivo de 10-07-2022
Datos Nombre: Marilyn Anabel
3
Actividades
Asignatura Datos del alumno Fecha
Ingeniería para el Apellidos: Tunala Llumiugsi
Procesado Masivo de 10-07-2022
Datos Nombre: Marilyn Anabel
Cantidad de registros
columna origin y que tenga tantas filas como aeropuertos distintos de origen existan.
Crear un nuevo DataFrame llamado rutasDistintasDF que tenga dos
columnas origin, dest y que tenga tantas filas como rutas diferentes existan
4
Actividades
Asignatura Datos del alumno Fecha
Ingeniería para el Apellidos: Tunala Llumiugsi
Procesado Masivo de 10-07-2022
Datos Nombre: Marilyn Anabel
Ejercicio 2
Vuelos que llegan con retraso positivo, el retraso medio a la llegada de dichos vuelos,
para cada aeropuerto de destino. La nueva columna con el retraso medio a la llegada
debe llamarse retraso_medio. El DF resultante debe estar ordenado de mayor a
menor retraso medio.
© Universidad Internacional de La Rioja (UNIR)
5
Actividades
Asignatura Datos del alumno Fecha
Ingeniería para el Apellidos: Tunala Llumiugsi
Procesado Masivo de 10-07-2022
Datos Nombre: Marilyn Anabel
Ejercicio 3
Ajustar un modelo de DecisionTree de Spark para predecir si un vuelo vendrá o no
con retraso (problema de clasificación binaria), utilizando como variables predictoras
el mes, el día del mes, la hora de partida dep_time, la hora de llegada arr_time, el
tipo de avión (carrier), la distancia y el tiempo que permanece en el aire. Para ello,
sigue los siguientes pasos.
© Universidad Internacional de La Rioja (UNIR)
6
Actividades
Asignatura Datos del alumno Fecha
Ingeniería para el Apellidos: Tunala Llumiugsi
Procesado Masivo de 10-07-2022
Datos Nombre: Marilyn Anabel
© Universidad Internacional de La Rioja (UNIR)
7
Actividades
Asignatura Datos del alumno Fecha
Ingeniería para el Apellidos: Tunala Llumiugsi
Procesado Masivo de 10-07-2022
Datos Nombre: Marilyn Anabel
© Universidad Internacional de La Rioja (UNIR)
8
Actividades