6 Modelo Dimensional

Descargar como ppt, pdf o txt
Descargar como ppt, pdf o txt
Está en la página 1de 42

Modelo Dimensional

Ing. Agustn Ulln

Mapa del Curso


Inteligencia de Negocios

Metodologa Kimball

Planeamiento del Proyecto

Modelo del Negocio

Modelado Dimensional

Modelado Fsico

ETL

Minera de Datos

Reportes

Tabla de Contenido
Informacin y Conocimiento Sistemas transaccionales y sistemas analticos Inteligencia de negocios Almacenes de datos.

Objetivos
1. Describir el rol de la Inteligencia de Negocios (BI) y del Datawarehouse en el actual mercado. 2. Describir porque un Sistema de Procesamiento Transaccional en Lnea (OLTP) no se ajusta a un reporte analtico. 3. Describir como se procesa las consultas de soporte a las decisiones en un DW . 4. Explicar porque los negocios se orientan a manejar tecnologa de Datawarehouse.

MODELOS RELACIONALES Y DIMENSIONALES

Dos tcnicas
Modelo E-R Entidades Atributos Relaciones Modelo dimensional Hechos Dimensiones Medidas

E-R - Modelo dimensional


El modelo dimensional puede verse como un caso particular del modelo relacional.
Foreing keys Hecho Dimensin Entidad

Modelo Estrella
Eficiencia
Soportado por mltiples RDBMS Anlisis de datos de menor complejidad, debido a la denormalizacin

Modelo Copo de Nieve


Mayor normalizacin, es decir, los niveles de las jerarquas se normalizan. Mayor flexibilidad
Mayor dificultad de mantenimiento Joins ms costosos Menos registros en las dimensiones.

MODELADO DIMENSIONAL

Modelado Dimensional
Es una adaptacin del modelo relacional. Consiste de tablas de hechos que se caracterizan usando dimensiones y medidas. La informacin sobre un hecho (actividad) se representa mediante indicadores (medidas o atributos de hecho).
La informacin de cada dimensin se representa por un conjunto de atributos (atributos de dimensin). Una dimensin es el contexto de un hecho, tienden a ser discretas y jerrquicas. Un indicador es una cantidad que describe el hecho, debe ser agregables.

Conceptos bsicos
1. Hecho. Evento, actividad, item transaccin del negocio.
2. Medida. Atributo o medida de hechos, mtricas del negocio 3. Dimensin. Caracterstica de un hecho. 4. Jerarqua. Relaciones padre-hijo dentro de una dimensin 5. Tabla de hechos: Almacena eventos y las mtricas. 6. Tabla de dimensin. Almacenan las dimensiones.

Hechos

Representan un evento o actividad especfica, tiene dimensiones y medidas.


Representan un item de negocio, una transaccin o un evento que tiene significancia para el negocio. Corresponden a una coleccin de items de datos y datos de contexto. Son aquellos datos que residen en una tabla de hechos y que son utilizados para crear indicadores, a travs de sumarizaciones preestablecidas. Un hecho debe estar relacionado al menos con una dimensin: El tiempo.

Medidas Mtricas - Hechos

Es un atributo numrico de un hecho que representa la performance o comportamiento del negocio relativo a la dimensin Ejemplos: Ventas en $$ Cantidad de productos Total de transacciones Cantidad de pacientes admitidos Llamadas efectuadas. ImporteTotal = precioProducto * cantidadVendida Rentabilidad = utilidad / PN CantidadVentas = cantidad PromedioGeneral = AVG(notasFinales)

Hechos o medidas
Representan los valores que son analizados.
Caractersticas de las medidas: Deben ser numricas. Porque estos valores son las bases de las cuales el usuario puede realizar clculos. Cruzan todas las dimensiones en todos los niveles. Si la medida es no numrica debemos codificarla a un valor numrico y cuando tengamos que exponerla decodificarla para mostrarla con el valor original.

Hechos o medidas
Las medidas pueden clasificarse en: Naturales. Son aquellas que se obtiene por agregacin de los datos originales. Suma: suma los valores de las columnas Cuenta: conteo de los valores Mnima: valor mnimo Mxima: valor mximo Cuenta de Distintos: valores diferentes Calculadas Si se derivan de una medida natural. Clculos Matemticos Expresiones condicionales Alertas

Dimensiones

Es una caracterstica de un hecho que permite su anlisis posterior, en el proceso de toma de decisiones. Determina el contexto del hecho (quin particip, cundo y donde pas y su tipo).
Es una entidad de negocios respecto de la cual se deben calcular las mtricas (clientes, productos, tiempo)

Tienden a ser discretas y jerrquicas <pas, regin, departamento, provincia, distrito>.


Es una coleccin de miembros o unidades o individuos del mismo tipo que permite categorizar un hecho.

Dimensiones
Se utilizan como parmetros para los anlisis OLAP
Las dimensiones habituales son:
Dimensin Tiempo Geografa Cliente Vendedor Miembro Meses, Trimestre, Aos Pas, Regin, Ciudad Id Cliente Id Vendedor

Jerarqua de las dimensiones


Una jerarqua representa una relacin lgica entre los datos de una dimensin. Estos datos poseen una relacin padre-ho.

Jerarqua de las dimensiones


Tienen las siguientes caractersticas: Se presentan al interior de una dimensin. Pueden existir varios niveles (dos o ms) Relacin 1-n o padre-ho entre atributos consecutivos de un nivel superior y uno inferior.
Se pueden identificar cuando existen relaciones 1-n o padre-ho en la dimensin.

Origen de las Jerarquas

Entre los atributos de una dimensin se definen jerarquas.


Producto nro. producto

categora

tipo

Almacn ciudad almacn tipo regin

Tiempo da mes semana trimestre ao

Granularidad
La granularidad es el nivel de detalle en que se almacena la informacin.
Por ejemplo:
Datos de ventas o compras de una empresa, pueden registrarse da a da Datos pertinentes a pagos de sueldos o cuotas de socios, podrn almacenarse a nivel de mes.

A mayor nivel de detalle, mayor posibilidad analtica, ya que los mismos podrn ser resumidos o sumarizados. Los datos con granularidad fina (nivel de detalle) podrn ser resumidos hasta obtener una granularidad media o gruesa. No sucede lo mismo en sentido contrario.

Tablas de Hechos
Las tablas de hechos contienen las dimensiones y las medidas de los hechos.
Los hechos o medidas son los valores de datos que se analizan (son numricos). La tabla de hechos tiene una clave primaria compuesta por las claves primarias de las tablas de dimensiones relacionadas a este.
Dimensiones

Medidas o hechos

Tabla de dimensiones
Definen la organizacin lgica de los datos.

Tiene una PK (nica) y columnas de referencia:


Clave principal (PK) o identificador nico. Clave forneas. Datos de referencia primarios (identifican la dimensin) Datos de referencia secundarios (complementan la descripcin).

No siempre la PK del OLTP, corresponde con la PK de la tabla de dimensin relacionada.

EJERCICIO

Ejercicio
Etapas en la construccin de un modelo dimensional:
0
Requerimientos del usuario

Construccin de las Dimensiones

Armado de la Tabla de Hechos

Definicin de las Medidas

Decidir la granularidad

Requerimientos del usuario


Dimensiones

Medidas
Ventas_Importe Ventas_Costo

Tiempo
X X

Sucursal
X X

Vendedor
X X

Cliente
X X

Producto
X X

Ventas_Unidades
Ventas_ImporteTotal Ventas_Ganancia Ventas_Promedio

X
X X X

X
X X X

X
X X X

X
X X X

X
X X X

Decidir la granularidad
La granularidad:

Es el nivel de detalle al que se desea almacenar informacin sobre la actividad a modelar. Define el nivel atmico de datos en el almacn de datos. Determina el significado de las tuplas de la tabla de hechos. Determina las dimensiones bsicas del esquema.

Por ejemplo en la dimensin Sucursal:

Decidir la granularidad
Ejemplo de la dimensin fecha. Se desea los datos por:
Informacin anual Informacin semestral Informacin trimestral Informacin mensual. .... Informacin semanal Informacin diaria Transaccin en el OLTP

+ granularidad + detalle

Construccin de las dimensiones


Identificar las dimensiones que caracterizan el proceso al nivel de detalle (grnulo) que se ha elegido. De cada dimensin se debe decidir los atributos (propiedades) relevantes para el anlisis de la actividad. Entre los atributos de una dimensin existen jerarquas naturales que deben ser identificadas (da-mes-ao)
Tiempo. Sucursal. Vendedor. Cliente. Producto. Cundo se produce la actividad Donde est ubicado el almacn Quin ha vendido Quin es el destinatario de la actividad Cul es el objeto de la actividad

Dimensin Tiempo

Dimensin Sucursal

Dimensin Vendedor

2
Dimensin Cliente

* ** *** **** *****

Ao Semestre Trimestre Mes Da

*
** *** **** *****

Sucursal Tipo Sucursal Pas Provincia Ciudad

*
** ***

Sucursal Seccin Vendedor

*
** *** ****

Pas Provincia Ciudad Razn Social

Dimensiones

Medidas

Tiempo

Sucursal

Vendedor

Cliente

Producto

Ventas_Importe
Ventas_Costo Ventas_Unidades Ventas_ImporteTotal Ventas_Ganancia Ventas_Promedio

X
X X X X X

X
X X X X X

X
X X X X X

X
X X X X X

X
X X X X X

Dimensiones

Medidas

Tiempo

Sucursal

Vendedor

Cliente

Producto

Ventas_Importe
Ventas_Costo Ventas_Unidades Ventas_ImporteTotal Ventas_Ganancia Ventas_Promedio

X
X X X X X

X
X X X X X

X
X X X X X

X
X X X X X

X
X X X X X

Fact_Ventas ID_Tiempo ID_Producto ID_Cliente ID_Vendedor ID_Sucursal

Tabla de Hechos

Dimensiones

Medidas

Tiempo

Sucursal

Vendedor

Cliente

Producto

Ventas_Importe
Ventas_Costo Ventas_Unidades Ventas_ImporteTotal Ventas_Ganancia Ventas_Promedio

X
X X X X X

X
X X X X X

X
X X X X X

X
X X X X X

X
X X X X X

Definicin de las medidas


Fact_Ventas ID_Tiempo ID_Producto ID_Cliente ID_Vendedor ID_Sucursal Fact_Ventas Fact_Ventas ID_Tiempo ID_Fecha ID_Producto ID_Producto ID_Cliente ID_Cliente ID_Vendedor ID_Vendedor ID_Sucursal Ventas_Importe Ventas_Costo Ventas_Unidades

Medidas

Dimensin Tiempo

Dimensin Sucursal

Dimensin Vendedor

* ** *** **** *****

Ao Semestre Trimestre Mes Da

*
** *** **** *****

Sucursal Tipo Sucursal Pas Provincia Ciudad

*
** ***

Sucursal Seccin Vendedor

Fact_Ventas Fact_Ventas ID_Tiempo ID_Fecha ID_Producto ID_Producto ID_Cliente ID_Cliente ID_Vendedor ID_Vendedor ID_Sucursal Ventas_Importe Ventas_Costo Ventas_Unidades

Dimensin Cliente

*
** *** ****

Pas Provincia Ciudad Razn Social

ROLAP, MOLAP, HOLAP

Tipos de OLAP.
OLAP Relacional (ROLAP) OLAP Multidimensional (MOLAP) OLAP Hbrida (HOLAP)

Esquema Fsico
Existe tres formas de almacenar los datos:
AGREGACIONES Y DATOS

Base de Datos Relacional

Vista de Usuario Base de Datos Multidimensional

MOLAP - Multidimensional OLAP.


AGREGACIONES Y DATOS
DATOS AGREGACIONES

Base de Datos Relacional

Base de Datos Multidimensional

Vista de Usuario

Base de Datos Relacional

Base de Datos Multidimensional

Vista de Usuario

ROLAP - Relacional OLAP.

HOLAP - OLAP hbrido

MOLAP
En un sistema MOLAP (OLAP multidimensional) los datos se encuentran almacenados en una estructura multidimensional. Para optimizar los tiempos de respuesta, el resumen de la informacin es usualmente calculado por adelantado. Estos valores pre-calculados o agregaciones son la base de las ganancias de desempeo de este sistema.
Algunos sistemas utilizan tcnicas de compresin de datos para disminuir el espacio de almacenamiento en disco debido a los valores pre-calculados.

ROLAP
ROLAP (OLAP Relacional) es un sistema en el cual los datos se encuentran almacenados en una base de datos relacional. Tpicamente, los datos son detallados, evitando las agregaciones y las tablas se encuentran normalizadas.

HOLAP
Un sistema HOLAP (OLAP Hbrido) mantiene los registros detallados en la base de datos relacional, mientras que los datos resumidos o agregados se almacenan en una base de datos multidimensional separada.
Este mtodo de almacenamiento es una combinacin de los dos anteriores e intenta rescatar lo mejor de cada uno.

PREGUNTAS

También podría gustarte