Tarea Curso Herramientas para El Análisis de Big Data

Descargar como pdf o txt
Descargar como pdf o txt
Está en la página 1de 6

HERRAMIENTAS PARA EL ANÁLISIS

DE BIG DATA
APLICANDO LA CIENCIA DE DATOS EN UNA
ORGANIZACIÓN

CASO DE ESTUDIO: LIBRERÍA IZTACCIHUATL


Elaborado por: Andrea Katherine Guamo Morocho
APLICANDO LA CIENCIA DE DATOS EN UNA ORGANIZACIÓN

INDICE

TÍTULO: .................................................................................................................... 2

OBJETIVO: ............................................................................................................... 2

INTRODUCCIÓN ..................................................................................................... 3

IDENTIFICACIÓN DE LA EMPRESA ...................................................................... 3

DATOS PROPORCIONADOS ................................................................................. 3

CUESTIONES REFERENTES AL PLANTEAMIENTO DEL PROBLEMA ............... 4

CONCLUSION: ........................................................................................................ 5

1
APLICANDO LA CIENCIA DE DATOS EN UNA ORGANIZACIÓN

TÍTULO:

APLICANDO LA CIENCIA DE DATOS EN UNA ORGANIZACIÓN

OBJETIVO:

IDENTIFICAR LAS HERRAMIENTAS NECESARIAS PARA EL


ANÁLISIS; ESTRUCTURAS DE DATOS Y SERVICIOS DE LA NUBE
PARA DESARROLLAR UN MODELO BASADO EN CIENCIA DE
DATOS COMO APOYO A LA TOMA DE DECISIONES PARA UNA
ORGANIZACIÓN.

2
APLICANDO LA CIENCIA DE DATOS EN UNA ORGANIZACIÓN

INTRODUCCIÓN

El presente documento consiste en el análisis de un caso de estudio para la Librería Iztaccihuatl, para
cumplir con el objetivo planteado en base a los conocimientos adquiridos referente a Ciencia de Datos.

IDENTIFICACIÓN DE LA EMPRESA

• Datos Empresa
La Librería Iztaccihuatl ubicada en la ciudad de Monterrey, Nuevo León, México ha decidido desarrollar
un proyecto basada en ciencia de datos para mejorar sus indicadores de desempeño (KPI’s) y a la vez
desarrollar una mejor estrategia en la toma de decisiones.

DATOS PROPORCIONADOS
El archivo “books” contiene los siguientes datos:
• Id - Identificador del registro
• Book Id - Identificador del libro
• Number Editions - Número de ediciones
• ISBN - Clave estándar internacional del libro
• ISBN13 - Clave estándar extendida internacional del libro
• Authors - Autor del libro
• Original Publication - Fecha de publicación
• Original Title - Título original del libro
• Title - Título del libro
• Language Code - Clave de idioma del libro
• Average Rating - Promedio de la clasificación del libro
• Image - Enlace a la imagen de la portada del libro
• Small Image - Enlace a la imagen en versión optimizada de la portada del libro.

El archivo “top_books” contiene los siguientes datos:


• Position - Posición del libro en la clasificación del libro
• ISBN - Clave estándar extendida internacional del libro
• Title - Título del libro
• Author - Autor del libro
• Imprint - Editorial
• Publisher Group - Grupo Editorial
• Volume - Volumen de ventas hasta el 2010
• Value - Ventas determinadas por el volumen
• RRP - Precio recomendado para minoristas
• ASP - Precio promedio para venta
• Binding - Tipo de encuadernación
• Publ Date - Fecha de publicación
• Product Class - Clasificación del libro
• Classification - Clasificación General del libro

3
APLICANDO LA CIENCIA DE DATOS EN UNA ORGANIZACIÓN

El archivo “ratings” contiene los siguientes datos:


• Book Id - Identificador del libro
• User Id - Identificador del cliente/usuario que clasifico un libro
• Rating - Nivel de clasificación del libro.

El archivo “to_read” contiene los siguientes datos:


• User Id - Identificador del cliente/usuario que clasifico un libro
• Book Id - Identificador del libro

El archivo “books” contiene los datos generales de cada libro existente en la librería y además menciona
el promedio de clasificación de cada libro de acuerdo a las votaciones y compras del cliente.
El archivo “top_books” contiene el top 20 de los libros más vendidos de acuerdo a una clasificación
general.
El archivo “ratings” contiene los datos de los libros más votados por los clientes dentro del sitio web de
la librería.
El archivo “to_read” contiene las recomendaciones que cada cliente o usuario realiza en el sitio web
sobre libros para leer.

CUESTIONES REFERENTES AL PLANTEAMIENTO DEL PROBLEMA


• ¿Qué lenguaje de programación para ciencia de datos utilizaría para realizar el análisis de
datos de la Librería Iztaccihuatl?
El lenguaje de programación seleccionado es Python, ya que su desempeño es idóneo para la
incógnita planteada por el volumen de los datos proporcionados y por su fácil comprensión.

• ¿Qué predicciones se podrían obtener de los datos de la Librería Iztaccihuatl?


En base a los datos proporcionados, se puede realizar un Análisis Predictivo, con el fin de crear
diferentes estrategias comerciales en donde se puede prever y generar un pronóstico de ventas,
tendencias y poder así adelantarse a lo que requiere el cliente y preparar ofertas o número de
ejemplares para que la librería maneje un número correcto y maneje de manera eficiente el pedido
de libros según las necesidades del cliente.

POSIBLES PREDICCIONES:

• Clientes frecuentes: con KPI “to_read”, puedo creer perfiles de acuerdo a la información
proporcionada y así en base a diferentes edades generar clasificaciones populares de acuerdo al
rango de edad, así como a género literario, de esta manera se puede crear estrategias para un
mayor índice de ventas y distribución.
• Promociones: con la información de los “top_books” se puede presentar promociones para la
página web, para que la información y el alcance de la Librería vaya más allá de la tienda física,
y en la web información y promociones de los Libros más populares.
• Estreno de nuevos ejemplares: continuamente ejemplares son lanzados en los distintos
géneros literarios pero la estrategia de venta y promoción debe ir acorde al público interesado por
lo cual la publicidad visual debe ir acorde a los interesados. De esta manera la información
proporcionada de “ratings” es fundamental para creer esta posible predicción.

4
APLICANDO LA CIENCIA DE DATOS EN UNA ORGANIZACIÓN

• ¿Qué adecuaciones se podría hacer a los datos de la Librería Iztaccihuatl para poder
realizar un análisis predictivo?
A las clasificaciones presentadas se debe crear la correspondiente a las predicciones presentadas
en el trabajo, por lo cual existirán nuevos indicadores los cuales deben ser presentados de forma
clara y eficaz para su posterior ejecución.

• ¿Qué tipo de base de datos se utilizaría para alojar los análisis de los datos de la Librería
Iztaccihuatl?
En el caso en concreto de la Librería, continuamente las entradas serán actualizadas con material
(libros, revistas, artículos) que se generen y se adquieran para la distribución y venta de los mismos,
por ende, se recomienda una base de datos dinámica y bibliográfica, permitiendo que sea mucho
más fácil la entrada de nueva información y ubicación, aumentando la eficiencia y manejo de los
datos, de la misma forma se podrá visualizar y editar las KPI (indicadores) planteados y que pueden
ser planteados en base a las predicciones para un mejor desarrollo de las ventas y organización del
establecimiento.

• ¿Qué tipo de servicio de la nube podría contratar la Librería Iztaccihuatl para alojar la
información y el proyecto de ciencia de datos?
Los datos manejados y generados por el establecimiento en cuestión no son grandes en volumen,
por lo cual se podría utilizar el espacio de la nube público, con el fin de no gastar una cantidad de
dinero considerable, pero seguir contando con las prestaciones de tener los datos en la Nube y que
dé está manera la información esté respaldada y pueda ser manejado de mejor manera.

CONCLUSION:
El análisis predictivo, desarrolló un papel importante para el desarrollo del presente trabajo, por lo
cual, se realizó una revisión bibliográfica con el fin de tener una base sólida y entendimiento del
mismo para un mejor desarrollo y presentar un propuesta óptima y eficaz para la parte interesada,
las posibilidades son infinitas, en el trabajo se han presentado unas cuantas predicciones en base a
la información proporcionada, las mismas podrían aplicarse a un entorno mucho más exigente es
decir una librería mucho más extensa y con sucursales, a medida que la base de datos aumente su
manejo debe ser mejor cuidado y buscar un mejor manejo del mismo.

También podría gustarte