Introducción A La Ciencia de Datos y El Big Data

Descargar como pdf o txt
Descargar como pdf o txt
Está en la página 1de 10

Introducción a la Ciencia de Datos y el Big Data

Proyecto individual evaluado por pares


Utilizando la Ciencia de Datos en una Organización

Nombre: Daniel Isai Yañez Torres


Fecha: 04/01/2020
Índice

Introducción
Problema
Indicadores
Análisis
Decisiones
Conclusión
Introducción

En este trabajo se planteo que la Librería Iztaccihuatl decide desarrollar un


proyecto basado en Ciencia de Datos.
Se nos pide definir los indicadores mas importantes que podamos obtener de los
tres archivos que nos dieron y en base a eso proponer el análisis mas adecuado y
tomar decisiones. Los indicadores propuestos se basan mas en temas para notar las
clasificaciones promedio de los libros y la respuesta de los clientes.
Problema

La Librería Iztaccihuatl ubicada en la ciudad de Monterrey, Nuevo León, México


ha decidido desarrollar un proyecto basada en ciencia de datos para mejorar sus
indicadores de desempeño (KPI’s) y a la vez desarrollar una mejor estrategia en la
toma de decisiones.
En la carpeta denominada “datasets_books” se encuentran los siguientes archivos:
books; top_books; raitings; to_read.

Una vez analizada la información de la carpeta “datasets_books” deberás presentar


en un documento Word la respuesta a las siguientes preguntas:

 ¿Qué indicadores serían los más importantes a determinar de acuerdo a la


información presentada?
 ¿Qué tipo de análisis sería el más adecuado y por qué?
 ¿Qué decisiones se podrían tomar basadas en los descubrimientos o inferencias de
la información analizada?

El archivo “books” contiene los siguientes datos:

 Id - Identificador del registro


 Book Id - Identificador del libro
 Number Editions - Número de ediciones
 ISBN - Clave estándar internacional del libro
 ISBN13 - Clave estándar extendida internacional del libro
 Authors - Autor del libro
 Original Publication - Fecha de publicación
 Original Title - Título original del libro
 Title - Título del libro
 Language Code - Clave de idioma del libro
 Average Rating - Promedio de la clasificación del libro
 Image - Enlace a la imagen de la portada del libro
 Small Image - Enlace a la imagen en versión optimizada de la portada del libro.

El archivo “top_books” contiene los siguientes datos:

 Position - Posición del libro en la clasificación del libro


 ISBN - Clave estándar extendida internacional del libro
 Title - Título del libro
 Author - Autor del libro
 Imprint - Editorial
 Publisher Group - Grupo Editorial
 Volume - Volumen de ventas hasta el 2010
 Value - Ventas determinadas por el volumen
 RRP - Precio recomendado para minoristas
 ASP - Precio promedio para venta
 Binding - Tipo de encuadernación
 Publ Date - Fecha de publicación
 Product Class - Clasificación del libro
 Classification - Clasificación General del libro

El archivo “ratings” contiene los siguientes datos:

 Book Id - Identificador del libro


 User Id - Identificador del cliente/usuario que clasifico un libro
 Rating - Nivel de clasificación del libro.

El archivo “to_read” contiene los siguientes datos:

 User Id - Identificador del cliente/usuario que clasifico un libro


 Book Id - Identificador del libro
El archivo “books” contiene los datos generales de cada libro existente en la
librería y además menciona el promedio de clasificación de cada libro de acuerdo a
las votaciones y compras del cliente.
El archivo “top_books” contiene el top 20 de los libros más vendidos de acuerdo a
una clasificación general.
El archivo “raitings” contiene los datos de los libros más votados por los clientes
dentro del sitio web de la librería.

El archivo “to_read” contiene las recomendaciones que cada cliente o usuario


realiza en el sitio web sobre libros para leer.
Indicadores

Habiendo visto la carpeta de datos que posee la librería para realizar el proyecto se
presentaran los siguientes tres indicadores propuestos:
1. Rating promedio de todos los libros disponibles.
Del archivo de “books” se usara la columna de “Average Rating” para obtener
el promedio global de los libros en venta.
2. Porcentaje de libros leidos
Del archivo “to_read” se obtendrán los libros únicos que se han leído y se
obtendrá la proporción que representa de la cantidad total de libros del archivo
de “books”.
3. Rating promedio de libros
Del archivo “ratings” podemos obtener la clasificación dada para el libro por
los clientes en el sitio web.
Análisis

De los tres tipos de análisis que se presentaron en el curso, el análisis que


propondría con los datos que se obtienen seria un análisis predictivo.
Con el Analisis prescriptivo trataría de obtener relación visual de en base a las
características generales del libro (editorial, lenguaje y época de publicación)
como han sido clasificados en promedio y la cantidad de veces leído, además de
cuantos de ellos se encuentran en el top de ventas y asi tratar de encontrar
relaciones que lleven a mejores ventas.
Decisiones

En base a los indicadores propuestos y el rendimiento que van tenido se


procederán a las siguientes opciones.
Indicador 1:
Si el indicador a lo largo del tiempo va disminuyendo, se buscara, modificar el
tipo de libros por los cuales hayan tenido mejor aceptación.
Indicador 2:
Si este indicador disminuye será resultado en base a modificar campañas de
aceptación o promoción de libros disponibles en stock.
Si este indicador aumenta seria labor de venta para poder concretar ventas de la
personas que si mostraron interés en el.
Indicador 3:
Al igual que los dos indicadores anteriores.
Si este indicador disminuye, se buscara modificar campañas de promoción del
libro.
Conclusión

Derivado de la información que nos presto la Librería podemos realizar una


análisis exploratorio de datos en base a las características generales, luego
podemos proceder mediante pruebas de hipótesis a saber cuales de esas
características son mas significativas en promedio del libro o si el libro fue
leído o no.
Con los indicadores de desempeño podemos ver una visión general del
desempeño de la librería, mes a mes y con ello proceder a las decisiones
mencionadas anteriormente.

También podría gustarte