1.1.1.PPT - Introducción A Big Data
1.1.1.PPT - Introducción A Big Data
1.1.1.PPT - Introducción A Big Data
BDY7101
Introducción
a Big Data
Introducción a Big Data
Visión General
En esta clase aprenderás:
✓ Qué es el Big Data.
✓ Por qué se necesita Hadoop.
✓ Qué problemas resuelve Hadoop.
✓ Qué comprende Hadoop y su ecosistema.
Introducción a Big Data
El diluvio de datos
Estamos generando más datos que nunca:
– Transacciones financieras.
– Redes de sensores.
– Registros del servidor.
– Analy@cs.
– Correo electrónico y mensajes de texto.
– Medios de comunicación social.
Introducción a Big Data
Introducción a Big Data
El diluvio de datos
Y estamos generando datos más rápido que nunca:
– Automa@zación.
– Conexión a Internet ubicua.
– Contenido generado por el usuario.
Por ejemplo, la lectura de un solo disco de 3TB toma casi cuatro horas.
– No podemos procesar los datos hasta que los hayamos leído.
– Estamos limitados por la velocidad de un solo disco.
Computación monolí?ca
Tradicionalmente, el cálculo ha sido vinculado al procesador.
– Procesamiento intenso sobre pequeñas can@dades de datos.
Durante décadas, el obje?vo era una máquina más grande y más poderosa.
– Procesador más rápido, más memoria RAM.
Computación distribuida
El procesamiento moderno a gran escala se distribuye entre las máquinas.
– A menudo cientos o miles de nodos.
– Los marcos comunes incluyen MPI, PVM y Condor.
Una solución ideal debe tener (al menos) estas funciones adecuadas.
Puntos Esenciales
✓ Hoy estamos generando más datos que nunca.
✓ La computación monolí@ca es limitada, mientras que el procesamiento distribuido
puede escalar de manera más rápida.