Diapositiva Clase 1 - 180324

Descargar como pptx, pdf o txt
Descargar como pptx, pdf o txt
Está en la página 1de 12

Modelos de Gran Escala

Ing. Alejandro Llaves


email: [email protected]
PLANIFICACIÓN DE DICTADO DE MATERIA

Condiciones de regularidad y/o promoción de la cátedra:


- Aprobar el 100% de los exámenes parciales con calificación de 4 (cuatro) o más.
- Cumplir con las condiciones de regularización.
- Esta materia será promocional para los alumnos que aprueben los parciales con nota mayor a 8 (ocho).

Planificación de encuentros:

● Lunes 18/03: 1° encuentro Webinar – 19:00 a 20:30hs.


● Lunes 25/03: 2° encuentro Webinar – 19:00 a 20:30hs.
● Lunes 08/04: 3° encuentro Webinar – 19:00 a 20:30hs.
● Lunes 22/04: 4° encuentro Webinar – 19:00 a 20:30hs.
● Lunes 29/04: 1° Parcial – 19:00 a 20:00hs.
● Lunes 06/05: 5° encuentro Webinar – 19:00 a 20:30hs.
● Lunes 13/05: Recuperatorio 1er Parcial - 19:00 a 20:00hs.
● Lunes 20/05: 6° encuentro webinar – 19:00 a 20:30hs.
● Lunes 27/05: 7° encuentro webinar – 19:00 a 20:30hs.
● Lunes 03/06: 2do Parcial - 19:00 a 20:00hs.
● Lunes 10/06: Recuperatorio 2do Parcial – 19:00 a 20:00hs
UNIDADES
UNIDAD 1: Big Data en las organizaciones

1.1 - Definición de Big Data: Las 7V y más


1.2 - Big Data vs Machine Learning, IA y Business Intelligence
1.3 - Impacto en las organizaciones
1.4 - Nuestra organización hacia el Big Data.

UNIDAD 2: Tecnologías para el tratamiento de datos

2.1 - Almacenamiento a gran escala


2.2 - Procesamiento de datos
2.3 - Análisis y Visualización de datos

UNIDAD 3: Modelos y Algoritmos


3.1 - Modelos estadísticos
3.2 - Modelos predictivos
3.3 - Algoritmos
3.4 - Uso real del Big Data
3.4.1 - Retail y Transporte
3.4.2 - Finanzas
3.4.3 - Deportes
3.4.4 - Turismo
Comencemos, ¿Qué es Big Data?

Supongamos que nos inciamos como emprendedores de servicios IT,


para ello tenemos:

- Datos de clientes
- Datos de proveedores
- Etc.

Y comenzamos por organizar su información:

Información no Información Nuestra BD


estructurada estructurada
¿Qué es el Big Data?

Luego nos damos cuenta, la información proviene de distintas fuentes:

La pregunta ahora sería, ¿cómo centralizamos toda la información?

Por ej, si un cliente me consulta por Whatsapp, pueda reconocer los últimos emails que me envió y
en nuestro sistema ERP, saber cuántas compras hizo el último año.
¿Qué es el Big Data? - Organizamos la información

Tiene costo alto de Aprendizaje automático. Las


Menor costo que OP, todos los Es un gran almacén de computadoras deben ser capaces
mantenimiento y requiere de
servicios de cómputo están en información. Petabytes. de aprender a traves de patrones
espacio fìsico
internet y detectar nuevos patrones para
hacer predicciones.
¿Qué es el Big Data? - Definición

Big Data es un gran volúmen de información que proviene de distintas fuentes y con diferentes
estructuras, necesitando mucho poder de cómputo la su procesamiento y análisis.

El Big Data se puede hacer también on premise a través de Hadoop por ejemplo, pero la tendencia es
irse a la nube ya que tenemos mas poder a menor costo.

El Big Data debe cumplir con:


¿Qué es el Big Data? - Las 7V
¿Qué es el Big Data? - Proceso ETL
Si los datos provienen de varias fuentes, ¿cómo podemos analizarlos como si fueran de una sola fuente?
Para esto, tenemos un proceso denominado ETL:

EXTRACCIÓN TRANSFORMACIÓN LOAD (CARGA)

Capturamos los datos que Estandarizamos los datos → Carga de la información en un


provienen de las diversas Data Cleanning. El Machine Data Warehouse para su
fuentes Learning nos puede ayudar en posterior análisis.
esta etapa.
La 4ta Revolución Industrial

● Existe una crecimiento exponencial de los datos


● Cada vez es más barato almacenar datos. Esto hace que dupliquemos la información cada 3 años
● El 90% de la información que hay, se generó en los últimos 2 años.
● Entonces, los datos están pero hay que hacerles buenas preguntas.
● Los datos son tan buenos, como las preguntas que les hacemos → Aquí surge la Ciencia de Datos
● Los científicos de datos trabajan con pequeños, medianos y grandes volúmenes de datos de: redes sociales, GPS, teléfonos móviles, etc.
● ¿Cómo hacemos para encontrar valor en una gran fuente de datos? y favorezca a la toma de decisiones.
● Aquí los algoritmos hacen la diferencia. Por ej. Netflix genera recomendaciones y el 75% de los usuarios mira las mismas.
● Netflix mediante técnicas de análisis o Machine Leraning, si miramos desde un móvil o computadoras, horarios, qué tipo de pelìculas, etc.
● Las empresas que no incorporen ciencia de datos, pueden desaparecer.
● Por ejemplo, una Universidad por qué los abandonan una carrera.
● Se estima que estamos analizando menos del 20% de la información existente
● En los proyectos de Ciencias de Datos debe haber una diversidad de visiones.
● Con el auge del IoT, Internet 5G y la Computación Cuántica, el Big Data quedará chico vendrá una nueva era → HUGE DATA
¿Qué veremos en la materia?
¿Consultas?

También podría gustarte