Tarea Curso Herramientas para El Análisis de Big Data
Tarea Curso Herramientas para El Análisis de Big Data
Tarea Curso Herramientas para El Análisis de Big Data
DE BIG DATA
APLICANDO LA CIENCIA DE DATOS EN UNA
ORGANIZACIÓN
INDICE
TÍTULO: .................................................................................................................... 2
OBJETIVO: ............................................................................................................... 2
INTRODUCCIÓN ..................................................................................................... 3
CONCLUSION: ........................................................................................................ 5
1
APLICANDO LA CIENCIA DE DATOS EN UNA ORGANIZACIÓN
TÍTULO:
OBJETIVO:
2
APLICANDO LA CIENCIA DE DATOS EN UNA ORGANIZACIÓN
INTRODUCCIÓN
El presente documento consiste en el análisis de un caso de estudio para la Librería Iztaccihuatl, para
cumplir con el objetivo planteado en base a los conocimientos adquiridos referente a Ciencia de Datos.
IDENTIFICACIÓN DE LA EMPRESA
• Datos Empresa
La Librería Iztaccihuatl ubicada en la ciudad de Monterrey, Nuevo León, México ha decidido desarrollar
un proyecto basada en ciencia de datos para mejorar sus indicadores de desempeño (KPI’s) y a la vez
desarrollar una mejor estrategia en la toma de decisiones.
DATOS PROPORCIONADOS
El archivo “books” contiene los siguientes datos:
• Id - Identificador del registro
• Book Id - Identificador del libro
• Number Editions - Número de ediciones
• ISBN - Clave estándar internacional del libro
• ISBN13 - Clave estándar extendida internacional del libro
• Authors - Autor del libro
• Original Publication - Fecha de publicación
• Original Title - Título original del libro
• Title - Título del libro
• Language Code - Clave de idioma del libro
• Average Rating - Promedio de la clasificación del libro
• Image - Enlace a la imagen de la portada del libro
• Small Image - Enlace a la imagen en versión optimizada de la portada del libro.
3
APLICANDO LA CIENCIA DE DATOS EN UNA ORGANIZACIÓN
El archivo “books” contiene los datos generales de cada libro existente en la librería y además menciona
el promedio de clasificación de cada libro de acuerdo a las votaciones y compras del cliente.
El archivo “top_books” contiene el top 20 de los libros más vendidos de acuerdo a una clasificación
general.
El archivo “ratings” contiene los datos de los libros más votados por los clientes dentro del sitio web de
la librería.
El archivo “to_read” contiene las recomendaciones que cada cliente o usuario realiza en el sitio web
sobre libros para leer.
POSIBLES PREDICCIONES:
• Clientes frecuentes: con KPI “to_read”, puedo creer perfiles de acuerdo a la información
proporcionada y así en base a diferentes edades generar clasificaciones populares de acuerdo al
rango de edad, así como a género literario, de esta manera se puede crear estrategias para un
mayor índice de ventas y distribución.
• Promociones: con la información de los “top_books” se puede presentar promociones para la
página web, para que la información y el alcance de la Librería vaya más allá de la tienda física,
y en la web información y promociones de los Libros más populares.
• Estreno de nuevos ejemplares: continuamente ejemplares son lanzados en los distintos
géneros literarios pero la estrategia de venta y promoción debe ir acorde al público interesado por
lo cual la publicidad visual debe ir acorde a los interesados. De esta manera la información
proporcionada de “ratings” es fundamental para creer esta posible predicción.
4
APLICANDO LA CIENCIA DE DATOS EN UNA ORGANIZACIÓN
• ¿Qué adecuaciones se podría hacer a los datos de la Librería Iztaccihuatl para poder
realizar un análisis predictivo?
A las clasificaciones presentadas se debe crear la correspondiente a las predicciones presentadas
en el trabajo, por lo cual existirán nuevos indicadores los cuales deben ser presentados de forma
clara y eficaz para su posterior ejecución.
• ¿Qué tipo de base de datos se utilizaría para alojar los análisis de los datos de la Librería
Iztaccihuatl?
En el caso en concreto de la Librería, continuamente las entradas serán actualizadas con material
(libros, revistas, artículos) que se generen y se adquieran para la distribución y venta de los mismos,
por ende, se recomienda una base de datos dinámica y bibliográfica, permitiendo que sea mucho
más fácil la entrada de nueva información y ubicación, aumentando la eficiencia y manejo de los
datos, de la misma forma se podrá visualizar y editar las KPI (indicadores) planteados y que pueden
ser planteados en base a las predicciones para un mejor desarrollo de las ventas y organización del
establecimiento.
• ¿Qué tipo de servicio de la nube podría contratar la Librería Iztaccihuatl para alojar la
información y el proyecto de ciencia de datos?
Los datos manejados y generados por el establecimiento en cuestión no son grandes en volumen,
por lo cual se podría utilizar el espacio de la nube público, con el fin de no gastar una cantidad de
dinero considerable, pero seguir contando con las prestaciones de tener los datos en la Nube y que
dé está manera la información esté respaldada y pueda ser manejado de mejor manera.
CONCLUSION:
El análisis predictivo, desarrolló un papel importante para el desarrollo del presente trabajo, por lo
cual, se realizó una revisión bibliográfica con el fin de tener una base sólida y entendimiento del
mismo para un mejor desarrollo y presentar un propuesta óptima y eficaz para la parte interesada,
las posibilidades son infinitas, en el trabajo se han presentado unas cuantas predicciones en base a
la información proporcionada, las mismas podrían aplicarse a un entorno mucho más exigente es
decir una librería mucho más extensa y con sucursales, a medida que la base de datos aumente su
manejo debe ser mejor cuidado y buscar un mejor manejo del mismo.