4 Diseño Data Mart I
4 Diseño Data Mart I
4 Diseño Data Mart I
3. El Modelo fsico del Data Mart: Tablas de dimensin Tablas de hechos. El modelo STAR. El modelo SNOWFLAKE. El modelo STAR vs. el modelo SNOWFLAKE
4. Documentacin de los elementos de diseo. 5. Estimar el tamao de un Data Mart
Diferencias de diseo entre los sistemas tradicionales y los sistemas de Business Intelligence
Transaccionales: OLTP
Se definen entidades normalizadas Se normaliza hasta la tercera forma Diseos complejos de base de datos Almacena informacin al menor nivel de detalle transaccional Define diseos sencillos de base de datos fciles de entender por los usuarios Almacena datos a nivel transaccional y totalizados
Anlisis: OLAP
Se definen entidades desnormalizadas
Diferencias de diseo entre los sistemas tradicionales y los sistemas de Business Intelligence
OLTP Usuario Uso Accesos Tipo acceso T. respuesta Contenido Operativos, Profesionales TI Predecible, Repetitivo Alta R/W - actualizacin al campo Segundos Valores elementales OLAP Trabajadores de conocimiento Ad hoc, Heurstico Media y baja Lectura - Sumarizacin Segundos a minutos Datos sumarizados, derivados
Estabilidad
Funcin Diseo BD
Dinmicos
Operaciones da a da Orientado a la aplicacin
Estructura
# filas # usuarios DB Size mtrica
Transaccional (NORMALIZADA)
cientos miles 100 MB-GB rendimiento de la transaccin
Consultas (DESNORMALIZADA)
millones cientos 100GB-TR rendimiento de la consulta
Diferencias de diseo entre los sistemas tradicionales y los sistemas de Business Intelligence
Diseo lgico:
OLTP
Diagrama E-R
Entidad Atributo Relacin Normalizacin Integridad Referencial UML Lenguaje de Modelamiento Unificado UDM modelo dimensional unificado
Anlisis Diseo Desarrollo Implementacin Explotacin
OLAP
Cubos
Codificacin Granularidad
Miembros
Medidas
La tabla de hechos tiene relaciones de foreign key con cada una de las tablas de dimensin
Concepto de Diseo
1. Dimensin: Es una entidad de negocios respecto de la cual se deben calcular las mtricas. Ejemplos: clientes, productos, tiempo. 2. Dimension Table (tabla de dimensin): Tablas que Dimensin almacenan las dimensiones. 3. Fact table (tabla de hechos): Almacena eventos (por ejemplo, las ventas). Contiene las mtricas que miden la efectividad de las operaciones del negocio. 4. Fact (hecho): Es una fila de la fact table. Representa un evento especfico. Measures 5. Measures (medidas): Valores cuantitativos que almacenan las mtricas del negocio. Estn representados por columnas numricas en la fact table.
Fact Table
La medida Ventas, por s sola, carece de sentido. Quiero ver las ventas por producto? por tiempo? por distribuidor?
Cada uno de estos criterios produce una dimensin.
Uno a muchos
Medidas
Medidas
Funciones de agregaciones
SUM: Es por defecto. Significa que el valor de la medida para un miembro de una dimensin es igual a la suma de los valores para todos sus miembros hijos.
COUNT: Recupera la cuenta de registros en la tabla de hechos.
MIN: Significa que el valor de la medida para un miembro es igual al valor mnimo encontrado entre sus miembros hijos.
MAX: Significa que el valor de la medida para un miembro es igual al valor mximo encontrado entre sus miembros hijos. DISTINCT COUNT: Recupera la cuenta de registros en la tabla de hechos, eliminando las ocurrencias repetidas. NONE: No se efecta ningn tipo de agregacin
BY ACCOUNT: Agrega la medida de acuerdo con la funcin de agregacin asignada a las dimensiones de tipo Account.
Funciones de agregaciones
AVERAGE OF CHILDREN: Significa que el valor de la medida para un miembro de una dimensin es igual al promedio de los valores para todos sus miembros hijos no vacos. FIRST CHILD: Significa que el valor de la medida para un miembro es igual al valor de la medida para su primer miembro hijo. LAST CHILD: Significa que el valor de la medida para un miembro es igual al valor de la medida para su ltimo miembro hijo. FIRST NON EMPTY: Significa que el valor de la medida para un miembro es igual al valor de la medida para su primer miembro hijo no vaco. LAST NON EMPTY: Significa que el valor de la medida para un miembro es igual al valor de la medida para su ltimo miembro hijo no vaco.
Tabla Dimensin
El diseo de las tablas de dimensin es, generalmente, sencillo y de fcil comprensin. Sea, por ejemplo, la dimensin Producto. Los productos de la empresa se agrupan por familiar, las cuales contienen subfamilias de productos. Cada subfamilia consta de varias marcas de productos. Finalmente, cada marca contiene mltiples presentaciones de productos. El diseo de la tabla de dimensin PRODUCTO_DIM es :
Tabla de Hechos
Un data mart est constituido por tablas de hechos y tablas de dimensin. Cada tabla de hechos est enlazada con mltiples tablas de dimensin. El siguiente diseo corresponde con una tabla de hechos que almacena informacin de ventas: