Evaluación Entre Pares - EDX

Descargar como pdf o txt
Descargar como pdf o txt
Está en la página 1de 5

TECNOLÓGICO DE MONTERREY

TRABAJO DE EVALUACIÓN ENTRE PARES

2020

Título: Aplicando la Ciencia de Datos en una Organización

POR ELIZABETH GRILLO

1
INDICE

Consignas ---------- pág. 3

Introducción--------- pág. 4

Pregunta 1----------- pág. 4

Pregunta 2 ---------- pág. 4

Pregunta 3----------- pág. 5

Conclusión----------- pág. 6

2
Consignas:

Objetivo: Identificar las herramientas necesarias para el análisis, estructuras de datos y servicios
de la nube para desarrollar un modelo basado en Ciencia de Datos como apoyo a la toma de
decisiones para una organización

La Librería Iztaccihuatl ubicada en la ciudad de Monterrey, Nuevo León, México ha decidido


desarrollar un proyecto basada en ciencia de datos para mejorar sus indicadores de desempeño
(KPI’s) y a la vez desarrollar una mejor estrategia en la toma de decisiones.

En la carpeta denominada “datasets_books” se encuentran los siguientes archivos: books;


top_books; raitings; to_read. Te recomendamos utilizar la herramienta Python para analizar los
datos que se te proporcionan.

Una vez analizada la información de la carpeta “datasets_books” deberás presentar en un


documento Word la respuesta a las siguientes preguntas:

Responder:

1) ¿Qué lenguaje de programación para ciencia de datos utilizaría para realizar el análisis
de datos de la Librería Iztaccihuatl?

2) ¿Qué predicciones se podrían obtener de los datos de la Librería Iztaccihuatl?

3) ¿Qué adecuaciones se podría hacer a los datos de la Librería Iztaccihuatl para poder
realizar un análisis predictivo?

4) ¿Qué tipo de base de datos se utilizaría para alojar los análisis de los datos de la Librería
Iztaccihuatl?

5) ¿Qué tipo de servicio de la nube podría contratar la Librería Iztaccihuatl para alojar la
información y el proyecto de ciencia de datos?

----------

Notas importantes: Los requisitos para acreditar el proyecto son los siguientes:

• Introducción, en donde presentes las ideas que se revisarán en el proyecto.

• Identificar el tipo de lenguaje de programación para realizar el análisis de datos.

• Identificar al menos, 3 predicciones

• Identificar el tipo de base de datos seleccionado

• Determinar el tipo de servicio de la nube que la empresa contrataría

• Elaborar un documento que presente las respuestas a las interrogantes planteadas;


indicando los beneficios para la misma.

• Conclusiones.

3
INTRODUCCIÓN

El presente trabajo intentará resolver cuál serían las predicciones más importantes para la
Librería Iztaccihuatl y de qué manera esta organización puede mejorar sus estrategias para la
toma de decisiones futuras, en pos de mejorar su negocio. También se intentará evaluar que
herramientas sirven mejor para realizar estas predicciones

Se analizarán los archivos propuestos por la Universidad (books, top_books, ratings, to_read) y
se propondrán posibles soluciones para esta Librería.

• Pregunta 1: ¿Qué lenguaje de programación para ciencia de datos utilizaría para


realizar el análisis de datos de la Librería Iztaccihuatl?

Utilizaría Python por ser un lenguaje más fácil de aprender en comparación con R.

• Pregunta 2: ¿Qué predicciones se podrían obtener de los datos de la Librería


Iztaccihuatl?

Análisis predictivo: Quiero ver cómo puedo mejorar mis ventas a futuro. Como anticiparme a las
demandas del cliente.

Del archivo “books”, se necesita:

- Book ID – Identificador del libro


- Title - Título del libro

Necesito el usar estos 2 KPIs del archivo “books” para poder después identificar cuáles son los
Book_IDs y títulos de los siguientes archivos (dado que los archivos “rating” y “to_read” no
cuentan con esa información):

Del archivo “ratings”, se necesita:

- Book ID – Identificador del libro


- Rating – Nivel de clasificación del libro

Del archivo “to_read”, se necesita:

- User_id - identificador del cliente/usuario que clasificó un libro


- Book ID – Identificador del libro

Puedo relacionar el User_ID y Book_ID del archivo “to_read” con el Book_ID del archivo “ratings”
para poder detectar los clientes activos y que han votado dentro de la librería.

Posibles predicciones:

-Con esta información, puedo detectar cuales son mis clientes (del archivo “to_read”), que libros
son los que más les gustaron (del archivo “ratings”), a que clasificación pertenecen (del archivo
“top_books)” y, de acuerdo a los gustos de los distintos clientes, puedo armar perfiles, clasificar
a los clientes por estos perfiles y armar listas de recomendación para cada perfil. Esto serviría
para poder armar un newsletter con recomendaciones de libros.

-Una de las estrategias puede ser promocionar en la página web de la Librería los libros que
cuenten con la misma clasificación que aquellos libros más vendidos hasta el 2010.

-También, se puede ser proponer libros que pertenezcan a esos autores más solicitados o mejor
rankeados.

4
-Tener presente que si uno de los autores más solicitados publica un nuevo libro, detectar ese
libro y promocionarlo.

• Pregunta 3: ¿Qué adecuaciones se podría hacer a los datos de la Librería


Iztaccihuatl para poder realizar un análisis predictivo?

Realizaría una nueva tabla que contenga los 6 datos que necesito de esos 3 archivos.

• Pregunta 4: ¿Qué tipo de base de datos se utilizaría para alojar los análisis de los datos
de la Librería Iztaccihuatl?

Justamente por la pregunta 3, necesito una base de datos relacional, para poder identificar con
los IDs aquellos libros que han sido más votados y cruzarlos con los archivos marcados como
“to read” por los clientes

• Pregunta 5: ¿Qué tipo de servicio de la nube podría contratar la Librería


Iztaccihuatl para alojar la información y el proyecto de ciencia de datos?
No son demasiados datos y tampoco requieren un gran nivel de seguridad. Utilizaría una nube
pública. No utilizaría una privada porque prefiero tener acceso desde cualquier dispositivo, y no
estar supeditada al entorno local de la librería.

Conclusión:

Del análisis prescriptivo (donde puedo anticiparme a lo que el cliente puede llegar a interesarle)
puedo desarrollar estrategias que me permitan entender qué paso y también como puedo hacer
para que la promoción de los libros recaiga en los clientes correctos (porque sus gustos fueron
detectados) y también para tener en cuenta qué tipo de autores o qué tipo de clasificación
(género) es el más demandado para poder poner foco en estos campos.

También podría gustarte