Modelado dimensional
Modelado dimensional (DM) es una técnica de estructura de datos optimizada para el almacenamiento de datos en un almacén de datos. El propósito del modelado tridimensional es optimizar la base de datos para una recuperación de datos más rápida. El concepto de modelado dimensional fue desarrollado por Ralph Kimball y contiene tablas de «hechos» y «dimensiones».
Un modelo tridimensional en un almacén de datos está diseñado para leer, resumir, analizar información numérica como valores, saldos, recuentos, pesos, etc. en un almacén de datos. Por el contrario, los modelos de relación están optimizados para agregar, actualizar y eliminar datos en un sistema de transacciones en línea en tiempo real.
Estos modelos tridimensionales y relativos tienen su forma única de almacenar datos que tiene ventajas únicas.
Por ejemplo, en el modo relativo, los modelos de normalización y ER reducen la redundancia en los datos. Por el contrario, un modelo tridimensional se instala en un data warehouse para que sea más fácil recuperar información y generar informes.
Por lo tanto, los modelos dimensionales se utilizan en sistemas de almacenamiento de datos y no es muy adecuado para sistemas relativos.
En este tutorial, aprenderá:
Elementos del modelo de datos dimensionales
Hecho
Los hechos son las medidas / métricas o hechos de su proceso empresarial. Para un proceso comercial de ventas, una medida sería una medida de ventas trimestral
Dimensiones
Dimension proporciona el contexto para un evento de proceso empresarial. En términos simples, dan quién, qué, dónde a la verdad. En el proceso de negocio de Ventas, en términos del número trimestral de ventas, habría dimensiones
- Quién – Nombres de clientes
- Dónde – Ubicación
- Qué – Nombre del producto
Es decir, una característica es una ventana para ver información en los hechos.
Rasgos
Las características son los diversos atributos de la dimensión en el modelado de datos tridimensionales.
En la función Ubicación, los atributos se pueden
Los atributos se utilizan para buscar, filtrar o clasificar hechos. Las tablas de dimensiones contienen atributos
Tabla de hechos
Una tabla de hechos es una tabla principal en el modelado dimensional.
Hay una tabla de hechos
- Medidas / hechos
- Clave externa para la tabla de dimensiones
Tabla de dimensiones
- Una tabla dimensional contiene las dimensiones de los hechos.
- Están conectados a una tabla de hechos mediante una clave externa.
- Las tablas de dimensiones son tablas de dimensiones.
- Los atributos dimensionales son las distintas columnas de una tabla de dimensiones.
- Las dimensiones dan atributos descriptivos de los hechos con la ayuda de sus atributos.
- No hay un límite establecido para el número de dimensiones.
- Esta característica también puede tener una o más relaciones jerárquicas.
Tipos de dimensiones en un almacén de datos
Los siguientes son los Tipos de dimensiones en un almacén de datos:
- Dimensión proporcional
- Toise estabilizador
- Dimensión encogida
- Dimensión de juego de roles
- Dimensión para la tabla de dimensiones
- Toise Junk
- Toise Degenerado
- Dimensión transferible
- Dimensión del paso
Pasos del modelado dimensional
La precisión de su modelado dimensional determina el éxito de la implementación de su almacén de datos. Estos son los pasos para crear un modelo de dimensión
- Identificación de procesos comerciales
- Identificación de granos (nivel de detalle)
- Identificación de dimensiones
- Identificar hechos
- Tomar una estrella
El modelo debe describir por qué, cuánto, cuándo / dónde / quién y qué de su proceso empresarial
Paso 1) Identificar el proceso empresarial
La identificación del proceso empresarial real debe incluirse en una casa de datos. Esto podría incluir marketing, ventas, recursos humanos, etc. análisis de los datos las necesidades de la organización. La selección del proceso empresarial también depende de la calidad de los datos disponibles para ese proceso. Es el paso más importante del proceso de modelado de datos, y la falla aquí sería fallas en cascada e irreversibles.
Para describir el proceso empresarial, puede utilizar texto sin formato o notación básica de Modelado de procesos empresariales (BPMN) o Lenguaje de modelado unificado (UML).
Paso 2) Identifique el grano
The Grain describe el nivel de detalle del problema / solución empresarial. Identificar el nivel más bajo de información para cualquier tabla en su almacén de datos es el proceso. Si los datos de ventas están en una tabla todos los días, entonces debe haber granularidad diaria. Si los datos de ventas completos están en una tabla para cada mes, hay una granularidad mensual.
Durante esta etapa, responde preguntas como
- ¿Necesitamos almacenar todos los productos disponibles o solo algunos tipos de productos? Esta decisión se basa en los procesos comerciales seleccionados para Datawarehouse
- ¿Almacenamos información de ventas de productos de forma mensual, semanal, diaria o por horas? Esta decisión depende del tipo de informes solicitados por los ejecutivos.
- ¿Cómo afectan las dos opciones anteriores al tamaño de la base de datos?
Ejemplo de grano:
El CEO de MNC quiere obtener ventas de productos específicos en diferentes lugares a diario.
Entonces, el grano es «información de ventas de productos por ubicación por día».
Paso 3) Identifique las dimensiones
Los sustantivos son dimensiones como fecha, tienda, inventario, etc. Estas son las dimensiones en las que se deben almacenar todos los datos. Por ejemplo, la función de fecha podría contener datos como año, mes y día de la semana.
Ejemplo de dimensiones:
El CEO de MNC quiere obtener ventas de productos específicos en diferentes lugares a diario.
Dimensiones: producto, ubicación y tiempo
Características: Para el producto: clave de producto (clave externa), nombre, tipo, especificaciones
Jerarquía: para la ubicación: país, estado, ciudad, dirección, nombre
Paso 4) Identifique el hecho
Esta etapa es relevante para los usuarios comerciales del sistema porque aquí es donde acceden a los datos almacenados en el almacén de datos. La mayoría de los conjuntos de tablas de hechos son valores numéricos como precio o costo por unidad, etc.
Hecho Hecho:
El CEO de MNC quiere obtener ventas de productos específicos en diferentes lugares a diario.
El quid de la cuestión es la cantidad de ventas por producto por ubicación por tiempo.
Paso 5) Construya el esquema
En este paso, aplica el modelo de dimensión. Un esquema es solo la estructura de la base de datos (configuración de la tabla). Hay dos esquemas populares
- Esquema de estrella
La arquitectura de esquema en estrella es fácil de diseñar. Se llama esquema de estrella porque el diagrama es como una estrella, con puntos que sobresalen del centro. El centro de la estrella consiste en la tabla de hechos y las tablas dimensionales de los puntos de la estrella.
Las tablas de hechos están hechas en un esquema de estrella que está en la tercera forma normal, pero las tablas tridimensionales están desnormalizadas.
- Esquema de alas de nieve
El esquema del ala de nieve es una extensión del esquema de estrella. En un esquema de alas de nieve, todas las características se normalizan y se vinculan a tablas dimensionales más grandes.
Reglas para el modelado dimensional
Las reglas y principios del modelado dimensional son los siguientes:
- Cargue datos atómicos en estructuras tridimensionales.
- Cree modelos tridimensionales en torno a los procesos comerciales.
- Es necesario asegurarse de que cada tabla de hechos tenga una tabla de dimensión de fecha asociada.
- Asegúrese de que todos los hechos en una tabla de hechos estén en el mismo nivel de grano o nivel de detalle.
- Es necesario almacenar etiquetas de informes y filtrar valores de dominio en tablas de dimensiones.
- Es necesario asegurarse de que las tablas dimensionales utilicen una llave de reemplazo
- Equilibrar continuamente el equilibrio y las realidades para proporcionar una solución empresarial que respalde su toma de decisiones.
Ventajas del modelado dimensional
- La estandarización dimensional permite generar informes fácilmente en todas las áreas de la empresa.
- Las tablas dimensionales almacenan el historial de información tridimensional.
- Permite introducir una dimensión completamente nueva sin mucha alteración de la tabla de hechos.
- También comience a almacenar datos de una manera que facilite la recuperación de la información de los datos una vez que los datos se almacenan en la base de datos.
- Una comparación con la tabla tridimensional del modelo normalizado es más fácil de entender.
- La información se agrupa en categorías comerciales claras y sencillas.
- El modelo tridimensional es muy comprensible para la empresa. Este modelo se basa en términos comerciales, por lo que la empresa sabe qué significa cada hecho, característica o atributo.
- Los modelos dimensionales se deforman y optimizan para realizar consultas rápidas de datos. Muchas plataformas de bases de datos relacionales reconocen este modelo y optimizan los planes de ejecución de consultas para mejorar el rendimiento.
- El modelado dimensional en un almacén de datos crea un esquema optimizado para un alto rendimiento. Significa menos uniones y ayuda a minimizar la redundancia de datos.
- El modelo tridimensional también ayuda a mejorar el rendimiento de las consultas. Está más degradado, por lo que está optimizado para interrogar.
- Los modelos dimensionales pueden adaptarse cómodamente al cambio. Es posible agregar más columnas en tablas de dimensiones sin interrumpir las aplicaciones de información empresarial existentes cuando se utilizan estas tablas.
¿Qué es el modelo de datos multidimensional en un almacén de datos?
Modelo de datos multidimensional el almacén de datos es un modelo que muestra datos en forma de cubos de datos. Permite modelar y visualizar los datos en múltiples dimensiones y definirlos por dimensiones y hechos. Un modelo de datos multidimensional generalmente se clasifica en torno a un tema central y se ilustra con una tabla de hechos.
Resumen:
- Un modelo tridimensional es una técnica de estructura de datos optimizada para Herramientas de almacenamiento de datos.
- Los hechos son las medidas / métricas o hechos de su proceso empresarial.
- Dimension proporciona el contexto para un evento de proceso empresarial.
- Las características del modelado son el modelado dimensional.
- Una tabla de hechos es una tabla primaria en un modelo tridimensional.
- Una tabla dimensional contiene las dimensiones de los hechos.
- Hay tres tipos de hechos: 1. Complemento 2. No complemento 3. Semi-complemento.
- Los tipos de dimensiones son proporcionales, estabilizadores, encogidos, de juego de roles, dimensionales dimensionales, basura, degenerados, intercambiables y escalonados.
- Los cinco pasos del modelado dimensional son 1. Identificar un proceso comercial 2. Identificar granos (nivel de detalle) 3. Identificar dimensiones 4. Identificar hechos 5. Construir una estrella
- Para el modelado dimensional en un almacén de datos, es necesario asegurarse de que cada tabla de hechos tenga una tabla de dimensión de fecha asociada.