¡Te damos la bienvenida a Scribd!

0% encontró este documento útil (0 votos)

41 vistas

Tunala Marilyn Act1 Procesado

Cargado por

El documento describe una actividad sobre el manejo de HDFS, Spark SQL y MLlib. La actividad incluye crear una carpeta en HDFS, cargar y explorar un archivo CSV usando Spark SQL, y realizar tres ejercicios de modelado de datos usando MLlib como predecir retrasos de vuelos con un modelo de árbol de decisión.

Copyright:

Formatos disponibles

Descargue como PDF, TXT o lea en línea desde Scribd

Tunala Marilyn Act1 Procesado

Cargado por

anabl.0812

0% encontró este documento útil (0 votos)

41 vistas8 páginas

Descripción original:

Título original

Tunala_Marilyn_Act1_procesado

Derechos de autor

Formatos disponibles

PDF, TXT o lea en línea desde Scribd

Compartir este documento

Compartir o incrustar documentos

Opciones para compartir

¿Le pareció útil este documento?

¿Este contenido es inapropiado?

Copyright:

Formatos disponibles

Descargue como PDF, TXT o lea en línea desde Scribd

Descargar como pdf o txt

0% encontró este documento útil (0 votos)

41 vistas8 páginas

Tunala Marilyn Act1 Procesado

Cargado por

anabl.0812

Copyright:

Formatos disponibles

Descargue como PDF, TXT o lea en línea desde Scribd

Descargar como pdf o txt

Saltar a página

Está en la página 1de 8

Buscar dentro del documento

Asignatura Datos del alumno Fecha

Ingeniería para el Apellidos: Tunala Llumiugsi

Procesado Masivo de 10-07-2022
Datos Nombre: Marilyn Anabel

Actividad 1: HDFS, Spark SQL y MLlib

 PARTE 1. Manejo de HDFS. Tras acceder a la terminal de Linux en Jupyter Lab, el
alumno deberá:

• Crear en el directorio raíz de HDFS una carpeta llamada <nombre_apellidos_

alumno> (sin tildes ni espacios), utilizando el comando de HDFS apropiado.
© Universidad Internacional de La Rioja (UNIR)

Se ha cargado el archivo csv

1
Actividades
Asignatura Datos del alumno Fecha
Ingeniería para el Apellidos: Tunala Llumiugsi
Procesado Masivo de 10-07-2022
Datos Nombre: Marilyn Anabel

 PARTE 2. Manejo de Apache Spark con notebooks de Jupyter.

La segunda parte de la tarea se continuó con Cloud Databricks, donde se cargó el
archivo manualmente.
© Universidad Internacional de La Rioja (UNIR)

2
Actividades
Asignatura Datos del alumno Fecha
Ingeniería para el Apellidos: Tunala Llumiugsi
Procesado Masivo de 10-07-2022
Datos Nombre: Marilyn Anabel

Lectura del archivo

Impresión del esquema

3
Actividades
Asignatura Datos del alumno Fecha
Ingeniería para el Apellidos: Tunala Llumiugsi
Procesado Masivo de 10-07-2022
Datos Nombre: Marilyn Anabel

Cantidad de registros

Quitar las filas con registros NA

 PARTE 3. Spark MLlib. Las instrucciones se encuentran en el notebook.

Ejercicio 1
Crear un nuevo DataFrame llamado aeropuertosOrigenDF que tenga una
© Universidad Internacional de La Rioja (UNIR)

columna origin y que tenga tantas filas como aeropuertos distintos de origen existan.
Crear un nuevo DataFrame llamado rutasDistintasDF que tenga dos
columnas origin, dest y que tenga tantas filas como rutas diferentes existan

4
Actividades
Asignatura Datos del alumno Fecha
Ingeniería para el Apellidos: Tunala Llumiugsi
Procesado Masivo de 10-07-2022
Datos Nombre: Marilyn Anabel

Ejercicio 2
Vuelos que llegan con retraso positivo, el retraso medio a la llegada de dichos vuelos,
para cada aeropuerto de destino. La nueva columna con el retraso medio a la llegada
debe llamarse retraso_medio. El DF resultante debe estar ordenado de mayor a
menor retraso medio.
© Universidad Internacional de La Rioja (UNIR)

5
Actividades
Asignatura Datos del alumno Fecha
Ingeniería para el Apellidos: Tunala Llumiugsi
Procesado Masivo de 10-07-2022
Datos Nombre: Marilyn Anabel

Ejercicio 3
Ajustar un modelo de DecisionTree de Spark para predecir si un vuelo vendrá o no
con retraso (problema de clasificación binaria), utilizando como variables predictoras
el mes, el día del mes, la hora de partida dep_time, la hora de llegada arr_time, el
tipo de avión (carrier), la distancia y el tiempo que permanece en el aire. Para ello,
sigue los siguientes pasos.
© Universidad Internacional de La Rioja (UNIR)

6
Actividades
Asignatura Datos del alumno Fecha
Ingeniería para el Apellidos: Tunala Llumiugsi
Procesado Masivo de 10-07-2022
Datos Nombre: Marilyn Anabel
© Universidad Internacional de La Rioja (UNIR)

7
Actividades
Asignatura Datos del alumno Fecha
Ingeniería para el Apellidos: Tunala Llumiugsi
Procesado Masivo de 10-07-2022
Datos Nombre: Marilyn Anabel
© Universidad Internacional de La Rioja (UNIR)

8
Actividades

También podría gustarte

Actividad 2
Documento8 páginas
Actividad 2
afahcompany
Aún no hay calificaciones
Actividad 1
Documento9 páginas
Actividad 1
afahcompany
Aún no hay calificaciones
Trabajo Práctico Nº1 - Perspectivas Sociolinguisticas
Documento2 páginas
Trabajo Práctico Nº1 - Perspectivas Sociolinguisticas
Sol
Aún no hay calificaciones
Base de Datos Trabajo Final 3 Pasar A PDF
Documento17 páginas
Base de Datos Trabajo Final 3 Pasar A PDF
Daniel Benavidez
Aún no hay calificaciones
Intene05 t4 Tra
Documento3 páginas
Intene05 t4 Tra
andres felipe avila hernandez
Aún no hay calificaciones
Laboratorio. Uso de MongoDB
Documento21 páginas
Laboratorio. Uso de MongoDB
Viviana Bautista
Aún no hay calificaciones
Uso Avanzado de Bases de Datos NoSQL
Documento15 páginas
Uso Avanzado de Bases de Datos NoSQL
Mabbe Benalcazar
100% (3)
Creación de Especificaciones Léxicas - Edwin Urueta
Documento6 páginas
Creación de Especificaciones Léxicas - Edwin Urueta
Edwin Urueta
Aún no hay calificaciones
Por Que Se Pierden Las Ovejas
Documento100 páginas
Por Que Se Pierden Las Ovejas
anon_666413478
100% (8)
Algoritmos de Adaptación Social
Documento8 páginas
Algoritmos de Adaptación Social
Cristian Cañas Garcia
Aún no hay calificaciones
Datos 06 Act 1
Documento4 páginas
Datos 06 Act 1
Maritza Aguirre
Aún no hay calificaciones
Taller Grupal Unidad 3
Documento7 páginas
Taller Grupal Unidad 3
Leo Rosero
Aún no hay calificaciones
Actividad 3
Documento2 páginas
Actividad 3
silvana suqui
Aún no hay calificaciones
AA Actividad2 Quisaguano
Documento12 páginas
AA Actividad2 Quisaguano
FernandoQuisaguano
Aún no hay calificaciones
Autómatas de Estados Vacíos, Pilas y Expresiones Regulares
Documento24 páginas
Autómatas de Estados Vacíos, Pilas y Expresiones Regulares
andres
Aún no hay calificaciones
Comulidet 3 Tra
Documento3 páginas
Comulidet 3 Tra
Maite Villegas
Aún no hay calificaciones
Análisis Libre de Un Catálogo de Datos
Documento7 páginas
Análisis Libre de Un Catálogo de Datos
Arturo Varo
Aún no hay calificaciones
Munoz Guia2
Documento2 páginas
Munoz Guia2
adrianamunozag
Aún no hay calificaciones
Actividad 1
Documento3 páginas
Actividad 1
Da Va
Aún no hay calificaciones
Tarea 1 RPA
Documento9 páginas
Tarea 1 RPA
betto submarine
Aún no hay calificaciones
Mexmiart 04 T 9 Lab
Documento4 páginas
Mexmiart 04 T 9 Lab
Istavay Orbegoso Salas
Aún no hay calificaciones
Actividad 1 v1 Revisada
Documento10 páginas
Actividad 1 v1 Revisada
Joel Orellana
Aún no hay calificaciones
MUIA Razonamiento y Planificacion Resolucion Actividad 1
Documento15 páginas
MUIA Razonamiento y Planificacion Resolucion Actividad 1
Anthony Guzman Lopez
Aún no hay calificaciones
Compendio eMARISMA
Documento11 páginas
Compendio eMARISMA
juancmu
Aún no hay calificaciones
Guia IngenieriaProcesadoMasivoDatos
Documento10 páginas
Guia IngenieriaProcesadoMasivoDatos
Roberto López
Aún no hay calificaciones
MOLINA GUZMAN LUIS Informe Algoritmo Clasificacion
Documento4 páginas
MOLINA GUZMAN LUIS Informe Algoritmo Clasificacion
Luis Angel
Aún no hay calificaciones
Cuadro Comparativo Tecnologías de Big Data
Documento4 páginas
Cuadro Comparativo Tecnologías de Big Data
Guido Yungan
Aún no hay calificaciones
Manual de Prácticas - Apache Camel - Exponiendo Un Servicio SOAP
Documento35 páginas
Manual de Prácticas - Apache Camel - Exponiendo Un Servicio SOAP
Oscar Eduardo Mayor Jaramillo
Aún no hay calificaciones
A02 NPM
Documento7 páginas
A02 NPM
Nahum Morales
Aún no hay calificaciones
Examen Herramientas Visualizacion Modeloa
Documento14 páginas
Examen Herramientas Visualizacion Modeloa
Mar Martin
Aún no hay calificaciones
Actividad 6. Investigación Spark
Documento9 páginas
Actividad 6. Investigación Spark
Beatriz C.Flores
Aún no hay calificaciones
Ejercicio Practico Spark
Documento10 páginas
Ejercicio Practico Spark
EasyCode By Andres
Aún no hay calificaciones
Paradigmas de La Orientación A Objetos
Documento16 páginas
Paradigmas de La Orientación A Objetos
Omar Collazos
Aún no hay calificaciones
Diseño de Una Memoria Cache
Documento4 páginas
Diseño de Una Memoria Cache
OLIVIA BURGOS BLANCO
Aún no hay calificaciones
AWS Guia
Documento49 páginas
AWS Guia
avaldiris
Aún no hay calificaciones
Proc de Datos Masivos
Documento5 páginas
Proc de Datos Masivos
Laura Mariana Liedtke
Aún no hay calificaciones
AA13-EV1-Plan Gestion Del Riesgo
Documento27 páginas
AA13-EV1-Plan Gestion Del Riesgo
Diana Paola Hernandez
100% (3)
Protocolo SSL Tls
Documento1 página
Protocolo SSL Tls
dyva44
100% (1)
Ortiz Angel Cifrado Descifrado DES AES
Documento7 páginas
Ortiz Angel Cifrado Descifrado DES AES
Helo Ortiz
100% (1)
Mod03INF513 Presentacion
Documento184 páginas
Mod03INF513 Presentacion
Eric Patterson
Aún no hay calificaciones
Actividad 1 Cifrados
Documento6 páginas
Actividad 1 Cifrados
Löręną Pąląføx
100% (1)
Consultas y Subconsultas
Documento9 páginas
Consultas y Subconsultas
Alex Carrera
Aún no hay calificaciones
Tema 5
Documento32 páginas
Tema 5
Jean Carlos Erick Gabino Alves
Aún no hay calificaciones
Modulo 4 Seguridad en La Nube
Documento25 páginas
Modulo 4 Seguridad en La Nube
Jose Valenzuela
Aún no hay calificaciones
Colgii05t7 Laboratorio
Documento2 páginas
Colgii05t7 Laboratorio
Senior Autómata
Aún no hay calificaciones
Colgii29 t3 Act
Documento2 páginas
Colgii29 t3 Act
Manzano
0% (1)
Act3 Grupal
Documento6 páginas
Act3 Grupal
Henry Jimenez Rosero
Aún no hay calificaciones
Formato IEEE
Documento6 páginas
Formato IEEE
MARCELO JOSUE ARIAS DE LA TORRE
Aún no hay calificaciones
Actividad 4
Documento19 páginas
Actividad 4
Bryan
Aún no hay calificaciones
Laboratorio-Enunciado-Metodologías de Modelado de Amenazas
Documento27 páginas
Laboratorio-Enunciado-Metodologías de Modelado de Amenazas
Matheo_96k
Aún no hay calificaciones
Preguntas Test Tema10
Documento3 páginas
Preguntas Test Tema10
Pitersh
Aún no hay calificaciones
Gii32 t1 Trab
Documento4 páginas
Gii32 t1 Trab
Juan Diego
100% (1)
Taller de Modelamiento de Procesos de Negocio Con Bpmnnew
Documento45 páginas
Taller de Modelamiento de Procesos de Negocio Con Bpmnnew
Jhossy Lui Arellano Acero
Aún no hay calificaciones
Formulario-Copias-certificadas ANT
Documento1 página
Formulario-Copias-certificadas ANT
Daniel Cruz
100% (1)
Actividad 1 Modelado de Amenezas Estandar v1
Documento31 páginas
Actividad 1 Modelado de Amenezas Estandar v1
markos naranjo
Aún no hay calificaciones
ACTIVIDAD02
Documento9 páginas
ACTIVIDAD02
manuel piñeres
Aún no hay calificaciones
Delincuencia Informática en El Perú
Documento9 páginas
Delincuencia Informática en El Perú
Luz Vargas
Aún no hay calificaciones
Mia Actividad 1
Documento5 páginas
Mia Actividad 1
celiadatascience
Aún no hay calificaciones
Preocedimiento Actualizacion de Base de Datos
Documento4 páginas
Preocedimiento Actualizacion de Base de Datos
Mirko Cespedes
100% (1)
Actividad 2-Modelo Entidad Relación 2
Documento4 páginas
Actividad 2-Modelo Entidad Relación 2
Alejandra Poloche
Aún no hay calificaciones
Extraclase PH-No 3
Documento4 páginas
Extraclase PH-No 3
Barrezueta Ramón Carlos Isaac
Aún no hay calificaciones
Actividad 1
Documento3 páginas
Actividad 1
carlos arturo fierro diaz
Aún no hay calificaciones
Pastorela Guion Final
Documento14 páginas
Pastorela Guion Final
Johana Belem Martinez Gutierrez
Aún no hay calificaciones
"Resumen Analítico" Sobre Lo Determinado y Justificado, Racionalismo y Empirismo
Documento3 páginas
"Resumen Analítico" Sobre Lo Determinado y Justificado, Racionalismo y Empirismo
Naomi Martinez
Aún no hay calificaciones
Palabras Homófonas en Inglés
Documento5 páginas
Palabras Homófonas en Inglés
Maria Victoria Cano May
Aún no hay calificaciones
ExpoiOs 20172CR UJAP
Documento29 páginas
ExpoiOs 20172CR UJAP
prada
Aún no hay calificaciones
La Manzana de La Discordia de Diego Hernandez Vazquez
Documento3 páginas
La Manzana de La Discordia de Diego Hernandez Vazquez
Diego Hernández Vázquez
Aún no hay calificaciones
PAUTA DE OBSERVACIÓN FA Nivel Fonético - Fonoaudiológico
Documento3 páginas
PAUTA DE OBSERVACIÓN FA Nivel Fonético - Fonoaudiológico
Sukkie Love
Aún no hay calificaciones
Tarea Elizabet
Documento4 páginas
Tarea Elizabet
Yesica Berenice Fabian
Aún no hay calificaciones
Aptitud Verbal 2
Documento19 páginas
Aptitud Verbal 2
selenehuaynaterobles72
Aún no hay calificaciones
Los Aportes de Adorno y Max Horkheimer
Documento4 páginas
Los Aportes de Adorno y Max Horkheimer
Clark E Cie Torre
100% (1)
Los Conectores de Secuencia
Documento2 páginas
Los Conectores de Secuencia
Edgard Idme Molina
100% (1)
Mariano Perez Carrasco - Hacia Una Filosofia de La LENGUA VULGAR
Documento21 páginas
Mariano Perez Carrasco - Hacia Una Filosofia de La LENGUA VULGAR
JorgeArce
Aún no hay calificaciones
Gramática de Los Números en Inglés
Documento3 páginas
Gramática de Los Números en Inglés
RUTH ZEGARRA
Aún no hay calificaciones
Textos Biblicos
Documento1 página
Textos Biblicos
Joel Robles Luna
Aún no hay calificaciones
Actividad 1 REVISION DOCUMENTAL
Documento7 páginas
Actividad 1 REVISION DOCUMENTAL
Claudia Milena Ramirez Rios
Aún no hay calificaciones
Manual de Usuario 4GL
Documento77 páginas
Manual de Usuario 4GL
Dervis Jesus Pardo
Aún no hay calificaciones
Sesión 2
Documento38 páginas
Sesión 2
Derwin Rubén Ruiz
Aún no hay calificaciones
Biografia de Selma Lagerlof
Documento1 página
Biografia de Selma Lagerlof
domenicaarteagazambrano
Aún no hay calificaciones
Mi Historia de Vida Con Las Historias de Vida (Alfredo Molano)
Documento13 páginas
Mi Historia de Vida Con Las Historias de Vida (Alfredo Molano)
Henry Cördoba
0% (1)
11 Forma Basia 10 Elaborar
Documento4 páginas
11 Forma Basia 10 Elaborar
Delia Contreras
Aún no hay calificaciones
Ch'ulel
Documento18 páginas
Ch'ulel
Alex hega
Aún no hay calificaciones
El Artículo
Documento3 páginas
El Artículo
César Godínez
Aún no hay calificaciones
Mio Cid
Documento4 páginas
Mio Cid
santi caballero
Aún no hay calificaciones
Capitulo 6 - Transform Ada de Laplace
Documento36 páginas
Capitulo 6 - Transform Ada de Laplace
SistemasUnica
100% (5)
Gigabyte
Documento2 páginas
Gigabyte
bmc2k10
Aún no hay calificaciones
2.3 La Filosofã A de Descartes
Documento3 páginas
2.3 La Filosofã A de Descartes
Alvaro Quiñones
Aún no hay calificaciones
Referencia Contextual Habilidad Verval Bimestral
Documento2 páginas
Referencia Contextual Habilidad Verval Bimestral
Franchesko Gaël Hetreau Llantoy
Aún no hay calificaciones
Normas Apa Septima Edicion 6
Documento30 páginas
Normas Apa Septima Edicion 6
jorge Romero
Aún no hay calificaciones
Simulacro Letras 2023
Documento6 páginas
Simulacro Letras 2023
Samir Jimenez Checasaca
Aún no hay calificaciones