Evaluación Entre Pares - EDX
Evaluación Entre Pares - EDX
Evaluación Entre Pares - EDX
2020
1
INDICE
Introducción--------- pág. 4
Conclusión----------- pág. 6
2
Consignas:
Objetivo: Identificar las herramientas necesarias para el análisis, estructuras de datos y servicios
de la nube para desarrollar un modelo basado en Ciencia de Datos como apoyo a la toma de
decisiones para una organización
Responder:
1) ¿Qué lenguaje de programación para ciencia de datos utilizaría para realizar el análisis
de datos de la Librería Iztaccihuatl?
3) ¿Qué adecuaciones se podría hacer a los datos de la Librería Iztaccihuatl para poder
realizar un análisis predictivo?
4) ¿Qué tipo de base de datos se utilizaría para alojar los análisis de los datos de la Librería
Iztaccihuatl?
5) ¿Qué tipo de servicio de la nube podría contratar la Librería Iztaccihuatl para alojar la
información y el proyecto de ciencia de datos?
----------
Notas importantes: Los requisitos para acreditar el proyecto son los siguientes:
• Conclusiones.
3
INTRODUCCIÓN
El presente trabajo intentará resolver cuál serían las predicciones más importantes para la
Librería Iztaccihuatl y de qué manera esta organización puede mejorar sus estrategias para la
toma de decisiones futuras, en pos de mejorar su negocio. También se intentará evaluar que
herramientas sirven mejor para realizar estas predicciones
Se analizarán los archivos propuestos por la Universidad (books, top_books, ratings, to_read) y
se propondrán posibles soluciones para esta Librería.
Utilizaría Python por ser un lenguaje más fácil de aprender en comparación con R.
Análisis predictivo: Quiero ver cómo puedo mejorar mis ventas a futuro. Como anticiparme a las
demandas del cliente.
Necesito el usar estos 2 KPIs del archivo “books” para poder después identificar cuáles son los
Book_IDs y títulos de los siguientes archivos (dado que los archivos “rating” y “to_read” no
cuentan con esa información):
Puedo relacionar el User_ID y Book_ID del archivo “to_read” con el Book_ID del archivo “ratings”
para poder detectar los clientes activos y que han votado dentro de la librería.
Posibles predicciones:
-Con esta información, puedo detectar cuales son mis clientes (del archivo “to_read”), que libros
son los que más les gustaron (del archivo “ratings”), a que clasificación pertenecen (del archivo
“top_books)” y, de acuerdo a los gustos de los distintos clientes, puedo armar perfiles, clasificar
a los clientes por estos perfiles y armar listas de recomendación para cada perfil. Esto serviría
para poder armar un newsletter con recomendaciones de libros.
-Una de las estrategias puede ser promocionar en la página web de la Librería los libros que
cuenten con la misma clasificación que aquellos libros más vendidos hasta el 2010.
-También, se puede ser proponer libros que pertenezcan a esos autores más solicitados o mejor
rankeados.
4
-Tener presente que si uno de los autores más solicitados publica un nuevo libro, detectar ese
libro y promocionarlo.
Realizaría una nueva tabla que contenga los 6 datos que necesito de esos 3 archivos.
• Pregunta 4: ¿Qué tipo de base de datos se utilizaría para alojar los análisis de los datos
de la Librería Iztaccihuatl?
Justamente por la pregunta 3, necesito una base de datos relacional, para poder identificar con
los IDs aquellos libros que han sido más votados y cruzarlos con los archivos marcados como
“to read” por los clientes
Conclusión:
Del análisis prescriptivo (donde puedo anticiparme a lo que el cliente puede llegar a interesarle)
puedo desarrollar estrategias que me permitan entender qué paso y también como puedo hacer
para que la promoción de los libros recaiga en los clientes correctos (porque sus gustos fueron
detectados) y también para tener en cuenta qué tipo de autores o qué tipo de clasificación
(género) es el más demandado para poder poner foco en estos campos.