Principios Básicos de Big Data
Principios Básicos de Big Data
Principios Básicos de Big Data
Bienvenida
Estamos afrontando una era de cambio que ninguna generación anterior ha vivido en
términos de efectos económicos y sociales. Gran parte de este cambio que estamos viviendo
viene dado por la globalización y la digitalización de la economía. Las empresas están en
una carrera hacia la digitalización, con el foco en ser capaces de competir en una economía
que cada vez más es digital.
Introducción
La información no veraz tiene gran distorsión ya que nos daría como resultado un producto
que no cumple con las expectativas.
Si usamos fuentes no fiables podemos llegar a tener sesgos en el análisis de los datos que
nos puede llevar a tomar decisiones no correctas.
Un volumen mayor de datos nos ayuda a sacar conclusiones más exactas. Pero no solo
importa la cantidad, sino también la calidad de los datos para asegurar un resultado fiable.
¿Dónde podemos encontrar datos no estructurados?
Página web.
Videos.
HTML.
¿A qué se refiere la velocidad cómo característica de Big Data?
La velocidad hace referencia a la capacidad de conocer la información a la velocidad en la
que se genera.
A todas.
La velocidad hace referencia a la capacidad de tratar y procesar los datos durante el periodo
que sea válida para tener el producto actualizado y obtener así su máximo provecho.
¿Dónde podemos encontrar datos semi estructurados?
Hoja de cáculo.
Textos.
Página web.
Mark Zuckerberg.
Matei Zaharia.
Doug Cutting.
Jeff Dean.
Cuando nos referimos a un estudio de datos inferencial hablamos de...
Un estudio que tiene como objetivo encontrar y establecer conexiones entre los datos.
Buscamos correlaciones, linealidad y relaciones entre las variables.
Un estudio que trata de explicar que ocurre a una variable cuando se cambia otra.
Un estudio que tiene como objetivo probar teorías que se ven muy afectadas por la muestra
de los datos ya que no contamos solo una parte de los datos y su incertidumbre. Es el
objetivo de los modelos estadísticos.
Un estudio en el que el científico de datos se basa en los datos que tiene para predecir el
futuro.
Las fases de un proyecto Big Data son...
Cuatro.
Seis.
Tres.
Cinco.
¿Qués es la programación distribuida?
El uso de diferentes máquinas que colaboran entre si para dar una solución a un problema.
Cuando hablamos de Big Data nos referimos a un volumen de datos que se puede manejar
con herramientas como hojas de cálculo de Excel.
El concepto Big Data es un concepto que hace referencia a una cantidad voluminosa de
datos estructurados, semiestructurados y no estructurados que tienen el potencial de ser
ecxtraídos para obtener información.
Toda la organización.
CDO.
CEO.
Data Owner.
¿Quién acuñó la expresión Inteligencia Artificial?
Doug Cutting.
Andreas Kaplan.
John McCarthy .
Alan Turing.
¿Cuál es la pirámide del tratamiento de datos comenzando desde la base a la cúspide?
Que están en abiertos y cualquier persona las puede utilizar. Además permiten el acceso a
su código de programación.
Diccionario de datos.
Biblioteca de datos.
Cuadro de mando.
Arquitectura de datos.
Creación de datos.
Gestión de operaciones.
Gestión de la seguridad.
La Conferencia de Darmouth supuso el nacimiento de la Inteligencia Artificial ¿En
qué año se produjo?
1950.
1957.
1956.
1946.
¿Cuándo hablamos de Información en la pirámide del tratamiento de datos?
Tipos de datos
Conoce los distintos tipos de datos que podemos tener como base para hacer una correcta
visualización.
Su experiencia.
Su sector.
Su última promoción.
Su posición.
¿Cómo usan Netflix y compañías similares Big Data?
Usan los datos de los usuarios para decidir que tipos de contenidos crear y así incrementar
la satisfacción de los usuarios que tienen cada vez más contenidos que les gustan en la
plataforma.
Usan los datos de los usuarios, para establecer el precio mensual en función del nivel
socioeconómico de los usuarios.
Usan los datos de los usuarios para hacerles encuestas y así aumentar el conocimiento sobre
ellos.
Procesa sobre todo información no estructurada, como lenguaje natural o redes sociales.
Gestores la utilizan sobre todo para convertir sus empresas en organizaciones eficaces y
eficientes.
¿Qué porcentaje de información que procesa nuestro celebro se capta a través de la
vista?
70%
80%
40%
55%
¿Cómo funciona el sistema de recomendación colaborativo?
Se usa las herramientas del análisis de Big Data de manera extensiva para analizar los
precios que cada usuario estaría dispuesto a pagar por los productos y les recomienda estos
productos.
El sistema geolocaliza y analiza los contenidos en redes sociales y cruza esta información
con los productos disponibles en sus tiendas. Si se esta hablando de un producto que no
tienen en el catálogo, lo incorporan.
Primero se identifica todos los usuarios que han visto los mismos contenido. En el segundo
paso un algoritmo calcula basado en el rating de otros usuarios el rating que el usuario daría
a estos contenidos.
Sugerir enfado.
Distraer el foco.
¿Cuál de estos elementos de visualización no tiene propiedad de orden natural?
Formas.
Etiquetas de textos.
Longitud.
Brillo.