Saltar al contenido

¿Qué es el modelado dimensional en un almacén de datos?

Modelado dimensional

Modelado dimensional (DM) es una técnica de estructura de datos optimizada para el almacenamiento de datos en un almacén de datos. El propósito del modelado tridimensional es optimizar la base de datos para una recuperación de datos más rápida. El concepto de modelado dimensional fue desarrollado por Ralph Kimball y contiene tablas de «hechos» y «dimensiones».

Un modelo tridimensional en un almacén de datos está diseñado para leer, resumir, analizar información numérica como valores, saldos, recuentos, pesos, etc. en un almacén de datos. Por el contrario, los modelos de relación están optimizados para agregar, actualizar y eliminar datos en un sistema de transacciones en línea en tiempo real.

Estos modelos tridimensionales y relativos tienen su forma única de almacenar datos que tiene ventajas únicas.

Por ejemplo, en el modo relativo, los modelos de normalización y ER reducen la redundancia en los datos. Por el contrario, un modelo tridimensional se instala en un data warehouse para que sea más fácil recuperar información y generar informes.

Por lo tanto, los modelos dimensionales se utilizan en sistemas de almacenamiento de datos y no es muy adecuado para sistemas relativos.

En este tutorial, aprenderá:

Elementos del modelo de datos dimensionales

Hecho

Los hechos son las medidas / métricas o hechos de su proceso empresarial. Para un proceso comercial de ventas, una medida sería una medida de ventas trimestral

Dimensiones

Dimension proporciona el contexto para un evento de proceso empresarial. En términos simples, dan quién, qué, dónde a la verdad. En el proceso de negocio de Ventas, en términos del número trimestral de ventas, habría dimensiones

Es decir, una característica es una ventana para ver información en los hechos.

Rasgos

Las características son los diversos atributos de la dimensión en el modelado de datos tridimensionales.

En la función Ubicación, los atributos se pueden

Los atributos se utilizan para buscar, filtrar o clasificar hechos. Las tablas de dimensiones contienen atributos

Tabla de hechos

Una tabla de hechos es una tabla principal en el modelado dimensional.

Hay una tabla de hechos

  1. Medidas / hechos
  2. Clave externa para la tabla de dimensiones

Tabla de dimensiones

Tipos de dimensiones en un almacén de datos

Los siguientes son los Tipos de dimensiones en un almacén de datos:

Pasos del modelado dimensional

La precisión de su modelado dimensional determina el éxito de la implementación de su almacén de datos. Estos son los pasos para crear un modelo de dimensión

  1. Identificación de procesos comerciales
  2. Identificación de granos (nivel de detalle)
  3. Identificación de dimensiones
  4. Identificar hechos
  5. Tomar una estrella

El modelo debe describir por qué, cuánto, cuándo / dónde / quién y qué de su proceso empresarial

Paso 1) Identificar el proceso empresarial

La identificación del proceso empresarial real debe incluirse en una casa de datos. Esto podría incluir marketing, ventas, recursos humanos, etc. análisis de los datos las necesidades de la organización. La selección del proceso empresarial también depende de la calidad de los datos disponibles para ese proceso. Es el paso más importante del proceso de modelado de datos, y la falla aquí sería fallas en cascada e irreversibles.

Para describir el proceso empresarial, puede utilizar texto sin formato o notación básica de Modelado de procesos empresariales (BPMN) o Lenguaje de modelado unificado (UML).

Paso 2) Identifique el grano

The Grain describe el nivel de detalle del problema / solución empresarial. Identificar el nivel más bajo de información para cualquier tabla en su almacén de datos es el proceso. Si los datos de ventas están en una tabla todos los días, entonces debe haber granularidad diaria. Si los datos de ventas completos están en una tabla para cada mes, hay una granularidad mensual.

Durante esta etapa, responde preguntas como

  1. ¿Necesitamos almacenar todos los productos disponibles o solo algunos tipos de productos? Esta decisión se basa en los procesos comerciales seleccionados para Datawarehouse
  2. ¿Almacenamos información de ventas de productos de forma mensual, semanal, diaria o por horas? Esta decisión depende del tipo de informes solicitados por los ejecutivos.
  3. ¿Cómo afectan las dos opciones anteriores al tamaño de la base de datos?

Ejemplo de grano:

El CEO de MNC quiere obtener ventas de productos específicos en diferentes lugares a diario.

Entonces, el grano es «información de ventas de productos por ubicación por día».

Paso 3) Identifique las dimensiones

Los sustantivos son dimensiones como fecha, tienda, inventario, etc. Estas son las dimensiones en las que se deben almacenar todos los datos. Por ejemplo, la función de fecha podría contener datos como año, mes y día de la semana.

Ejemplo de dimensiones:

El CEO de MNC quiere obtener ventas de productos específicos en diferentes lugares a diario.

Dimensiones: producto, ubicación y tiempo

Características: Para el producto: clave de producto (clave externa), nombre, tipo, especificaciones

Jerarquía: para la ubicación: país, estado, ciudad, dirección, nombre

Paso 4) Identifique el hecho

Esta etapa es relevante para los usuarios comerciales del sistema porque aquí es donde acceden a los datos almacenados en el almacén de datos. La mayoría de los conjuntos de tablas de hechos son valores numéricos como precio o costo por unidad, etc.

Hecho Hecho:

El CEO de MNC quiere obtener ventas de productos específicos en diferentes lugares a diario.

El quid de la cuestión es la cantidad de ventas por producto por ubicación por tiempo.

Paso 5) Construya el esquema

En este paso, aplica el modelo de dimensión. Un esquema es solo la estructura de la base de datos (configuración de la tabla). Hay dos esquemas populares

  1. Esquema de estrella

La arquitectura de esquema en estrella es fácil de diseñar. Se llama esquema de estrella porque el diagrama es como una estrella, con puntos que sobresalen del centro. El centro de la estrella consiste en la tabla de hechos y las tablas dimensionales de los puntos de la estrella.

Las tablas de hechos están hechas en un esquema de estrella que está en la tercera forma normal, pero las tablas tridimensionales están desnormalizadas.

  1. Esquema de alas de nieve

El esquema del ala de nieve es una extensión del esquema de estrella. En un esquema de alas de nieve, todas las características se normalizan y se vinculan a tablas dimensionales más grandes.

Reglas para el modelado dimensional

Las reglas y principios del modelado dimensional son los siguientes:

Ventajas del modelado dimensional

¿Qué es el modelo de datos multidimensional en un almacén de datos?

Modelo de datos multidimensional el almacén de datos es un modelo que muestra datos en forma de cubos de datos. Permite modelar y visualizar los datos en múltiples dimensiones y definirlos por dimensiones y hechos. Un modelo de datos multidimensional generalmente se clasifica en torno a un tema central y se ilustra con una tabla de hechos.

Resumen:

  • Un modelo tridimensional es una técnica de estructura de datos optimizada para Herramientas de almacenamiento de datos.
  • Los hechos son las medidas / métricas o hechos de su proceso empresarial.
  • Dimension proporciona el contexto para un evento de proceso empresarial.
  • Las características del modelado son el modelado dimensional.
  • Una tabla de hechos es una tabla primaria en un modelo tridimensional.
  • Una tabla dimensional contiene las dimensiones de los hechos.
  • Hay tres tipos de hechos: 1. Complemento 2. No complemento 3. Semi-complemento.
  • Los tipos de dimensiones son proporcionales, estabilizadores, encogidos, de juego de roles, dimensionales dimensionales, basura, degenerados, intercambiables y escalonados.
  • Los cinco pasos del modelado dimensional son 1. Identificar un proceso comercial 2. Identificar granos (nivel de detalle) 3. Identificar dimensiones 4. Identificar hechos 5. Construir una estrella
  • Para el modelado dimensional en un almacén de datos, es necesario asegurarse de que cada tabla de hechos tenga una tabla de dimensión de fecha asociada.

Entradas relacionadas

Deja una respuesta

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *