Introducción A La Ciencia de Datos y El Big Data - Proyecto Individual Evaluado Por Pares
Introducción A La Ciencia de Datos y El Big Data - Proyecto Individual Evaluado Por Pares
Introducción A La Ciencia de Datos y El Big Data - Proyecto Individual Evaluado Por Pares
Proyecto
Aplicando la Ciencia de Datos en una organización
I. INTRODUCCIÓN ............................................................................................................................................. 1
1.1 ANTECEDENTES ............................................................................................................................................... 1
1.2 OBJETIVO GENERAL......................................................................................................................................... 1
1.3 OBJETIVOS ESPECÍFICOS. ................................................................................................................................. 2
II. DESARROLLO DEL CICLO DE VIDA DEL PROYECTO ........................................................................ 2
2.1 COMPRESIÓN DEL NEGOCIO. ............................................................................................................................ 2
2.2 ADQUISICIÓN DE LOS DATOS ........................................................................................................................... 2
2.3 PREPARACIÓN DE DATOS ................................................................................................................................. 6
2.4 MODELACIÓN .................................................................................................................................................. 6
III. RESULTADOS Y RECOMENDACIONES. .............................................................................................. 8
3.1 DEFINICIÓN DE INDICADORES. ......................................................................................................................... 8
3.2 TIPO DE ANÁLISIS RECOMENDADO. .................................................................................................................. 8
3.3 DECISIONES INFERIDAS. ................................................................................................................................... 8
Introducción a la Ciencia de Datos y el Big Data
I. Introducción
1.1 Antecedentes
La Librería Iztaccihuatl ubicada en la ciudad de Monterey, Nuevo León, México se ve
actualmente en la necesidad de mejorar sus indicadores de desempeño y a la vez
desarrollar una mejor estrategia para la toma de decisiones. La librería cuenta con un
sitio web en donde se generan calificaciones de los libros por parte de los clientes. La
librería ha entregado una serie de documentos los cuales se analizan en el capitulo dos
de este documento.
Página 1 25/11/2020
Introducción a la Ciencia de Datos y el Big Data
El archivo Books es un catálogo maestro de 10,000 registros que representan los datos
generales de cada libro existente en la librería, además de contener el promedio de
clasificación de cada libro de acuerdo a las votaciones y compras de los clientes.
Página 2 25/11/2020
Introducción a la Ciencia de Datos y el Big Data
Página 3 25/11/2020
Introducción a la Ciencia de Datos y el Big Data
El archivo top_books contiene 120 registros con el top 20 de los libros más vendidos de
acuerdo a una clasificación general. El archivo contiene una serie de atributos de cada
libro desde características de identificación y generales, hasta ventas por volumen,
precios recomendados, etc.
Página 4 25/11/2020
Introducción a la Ciencia de Datos y el Big Data
Imprint Editorial
Página 5 25/11/2020
Introducción a la Ciencia de Datos y el Big Data
El archivo Ratings contiene 981,756 registros con los datos de los libros mas votados por
los clientes dentro del sitio web de la librería.
2.4 Modelación
Después de analizar la información proporcionada y su estructura, nos damos cuenta que
fácilmente se puede generar un modelo relacional como se presenta a continuación.
Página 6 25/11/2020
Introducción a la Ciencia de Datos y el Big Data
Revisando esta información identificamos que el tipo de análisis a realizar mas adecuado
de acuerdo a la data sería un Análisis Descriptivo.
Página 7 25/11/2020
Introducción a la Ciencia de Datos y el Big Data
1) Rating Promedio por Genero de libro, asi como también por Autor.
2) Volumen de Venta por Genero de libro.
3) Volumen de Venta por Rating y recomendaciones de lectura.
4) Recomendaciones de Lectura por Periodo de Tiempo.
5) Autores y Géneros mas recomendados.
El análisis recomendado en el descriptivo, dado que este será la base para identificar la
situación actual y a partir de este mejorar los datos para crear predicciones.
1) Adquirir libros de Géneros que tengan un alto rating y alto volumen de ventas,
promocionándolos a las personas que han realizado recomendaciones de lectura
de esos géneros.
2) Promocionar además los libros de los autores con altos niveles de ventas.
3) Mejorar la captura y clasificación de los datos del cliente adicionando atributos de
tiempo para saber en que momentos compra, recomienda, etc. Además de contar
cos los gustos de los clientes por clasificación.
Página 8 25/11/2020