Tabla de contenidos
¿Qué es OLAP?
Procesamiento de análisis en línea (OLAP) Es una categoría de software que permite a los usuarios analizar información de múltiples sistemas de bases de datos simultáneamente. Es una tecnología que permite a los analistas extraer y ver datos comerciales desde una variedad de perspectivas.
Los analistas a menudo necesitan agrupar, agregar y vincular datos. Estas operaciones se encuentran en bases de datos relacionales que consumen muchos recursos. Con OLAP es posible pre-calcular y pre-agregar datos, y hacer que el análisis sea más rápido.
Las bases de datos OLAP se dividen en uno o más cubos. Los cubos están diseñados para facilitar la creación y visualización de informes. OLAP significa procesamiento analítico en línea.
En este tutorial, aprenderá:
Cubo OLAP:
En el corazón del concepto OLAP se encuentra el Cubo OLAP. El cubo OLAP es una estructura de datos optimizada para un análisis de datos muy rápido.
El Cubo OLAP consta de hechos numéricos llamados medidas que se clasifican por dimensiones. El se llama Cubo OLAP hipervínculos.
Las operaciones y el análisis de datos se realizan normalmente utilizando una hoja de cálculo simple, donde los valores de los datos se organizan en un formato de fila y columna. Esto es ideal para datos bidimensionales. Sin embargo, OLAP contiene datos multidimensionales y, por lo general, los datos se obtienen de una variedad de fuentes no relacionadas. Usar una hoja de cálculo no es la mejor opción. El cubo puede almacenar y analizar datos multidimensionales de manera lógica y ordenada.
¿Como funciona?
El almacenamiento de datos extraería información de múltiples fuentes y formatos de datos, como archivos de texto, hojas de Excel, archivos multimedia, etc.
Los datos extraídos se limpian y transforman. Los datos se cargan en un servidor OLAP (o cubo OLAP) donde la información se calcula previamente para su posterior análisis.
Operaciones analíticas básicas de OLAP
Los siguientes son cuatro tipos de operaciones analíticas en OLAP:
- Enrollar
- Profundizar
- Parte y pica
- Pivote (rotación)
1) enrollar:
La acumulación también se denomina «consolidación» o «agregación». La operación Rolling se puede realizar de dos formas
- Reducir dimensiones
- Jerarquía de conceptos de escalada. Una jerarquía de conceptos es un sistema para agrupar objetos según su orden o nivel.
Considere el siguiente diagrama
- En este ejemplo, las ciudades de Nueva Jersey y Lost Angles y acumuladas hasta el país de EE.
- La cifra de ventas de Nueva Jersey y Los Ángeles es de 440 y 1560, respectivamente. Se convierten en 2000 después de enrollarse
- En este proceso de agregación, los datos mueven una jerarquía de ubicaciones hacia arriba de una ciudad a otro.
- En el proceso de enrollado es necesario eliminar una o más dimensiones. En este ejemplo, se elimina la función Quater.
2) Profundizar
En los datos de perforación hay fragmentación en partes más pequeñas. Es lo opuesto a un proceso de acumulación. Puede ser hecho por
- Descendiendo en la jerarquía de conceptos
- Dimensión creciente
Considere el diagrama de arriba
- El trimestre Q1 se perfora hasta enero, febrero y marzo. Las ventas correspondientes también son programas.
- En este ejemplo, se agregan meses dimensionales.
3) Rebanada:
Aquí, se selecciona una característica y se crea un nuevo subcubo.
Explique el siguiente diagrama cómo funcionaba una operación de corte:
- El tiempo de dimensión se desliza con Q1 como filtro.
- Se crea un cubo completamente nuevo.
Dado:
Esta operación es como una rebanada. La diferencia en un dado es que eliges 2 o más dimensiones que crean un subcubo como resultado.
4) Pivote
En Pivot, rota los ejes de datos para proporcionar una presentación de datos sustitutiva.
En el siguiente ejemplo, el pivote se basa en tipos de elementos.
Tipos de sistemas OLAP
Estructura OLAP jerárquica
Tipo OLAP | Explicación |
OLAP relacionado (ROLAP): | ROLAP es un RDBMS extendido combinado con mapeo de datos multidimensionales para realizar la operación relativa estándar. |
OLAP multidimensional (MOLAP) | MOLAP Ejecuta la operación en datos multidimensionales. |
Procesamiento híbrido en línea (HOLAP) | En el enfoque HOLAP, los totales agregados se almacenan en una base de datos multidimensional y los datos detallados se almacenan en la base de datos relacional. Esto proporciona la eficiencia de datos del modelo ROLAP y el rendimiento del modelo MOLAP. |
Escritorio OLAP (DOLAP) | En Desktop OLAP, un usuario descarga algunos de los datos de la base de datos localmente o en su escritorio y los analiza. DOLAP es relativamente más económico de implementar porque ofrece muy pocas funcionalidades en comparación con otros sistemas OLAP. |
OLAP Web (WOLAP) | Se puede acceder a Web OLAP en el sistema OLAP a través del navegador web. WOLAP es una arquitectura de tres niveles. Hay tres componentes: cliente, central y servidor de base de datos. |
OLAP móvil: | OLAP móvil ayuda a los usuarios a acceder y analizar datos OLAP utilizando sus dispositivos móviles |
OLAP espacial: | SOLAP se crea para facilitar la gestión de datos espaciales y no espaciales en un Sistema de Información Geográfica (SIG) |
ROLAP
ROLAP trabaja con datos contenidos en una base de datos relacional. Las tablas de hechos y dimensiones se almacenan como tablas relativas. También permite el análisis multidimensional de datos y es el OLAP de más rápido crecimiento.
Ventajas del modelo ROLAP:
- Alta eficiencia de datos. Ofrece alta eficiencia de datos porque el rendimiento de las consultas y el lenguaje de acceso están optimizados especialmente para el análisis de datos multidimensionales.
- Escalabilidad. Este tipo de sistema OLAP ofrece escalabilidad para administrar grandes cantidades de datos, e incluso cuando los datos aumentan constantemente.
Desventajas del modelo ROLAP:
- Mayor demanda de recursos: ROLAP requiere una alta utilización de recursos humanos, software y hardware.
- Límites de datos agregados. Las herramientas ROLAP utilizan SQL para calcular datos agregados. Sin embargo, no se han establecido límites para manejar los cálculos.
- Rendimiento de consulta lento. El rendimiento de las consultas en este modelo es lento en comparación con MOLAP
MOLAP
MOLAP utiliza motores de almacenamiento multidimensionales basados en matrices para mostrar vistas multidimensionales de datos. Básicamente, usan un cubo OLAP.
Más información sobre OLAP aquí
OLAP híbrido
OLAP híbrido es una combinación de ROLAP y MOLAP. Ofrece un cálculo rápido de MOLAP y una mayor escalabilidad de ROLAP. HOLAP utiliza dos bases de datos.
- Los datos agregados o calculados se almacenan en un cubo OLAP multidimensional
- La información detallada se almacena en una base de datos relacional.
Ventajas de OLAP Hybrid:
- Este tipo de OLAP ayuda a su economía de espacio en disco y también es compacto, lo que ayuda a evitar problemas relacionados con la velocidad de acceso y la conveniencia.
- Los HOLAP híbridos utilizan tecnología de cubo que permite un rendimiento más rápido para todo tipo de datos.
- ROLAP se actualiza inmediatamente y los usuarios de HOLAP tienen acceso a estos datos en tiempo real que se actualizan inmediatamente. MOLAP permite limpiar y convertir datos y así mejorar la relevancia de los datos. Esto saca lo mejor de ambos mundos.
Desventajas de OLAP híbrido:
- Mayor nivel de complejidad: El principal inconveniente de los sistemas HOLAP es que admite herramientas y aplicaciones ROLAP y MOLAP. Por tanto, es muy complejo.
- Posible superposición: Es más probable que se superpongan, especialmente en sus funcionalidades.
Beneficios de OLAP
- OLAP es una plataforma para todo tipo de negocios, incluida la planificación, elaboración de presupuestos, informes y análisis.
- El cubo OLAP contiene información y cálculos consistentes. Este es un beneficio vital.
- Cree y analice rápidamente situaciones hipotéticas
- Busque fácilmente términos generales o específicos en la base de datos OLAP.
- OLAP proporciona las piedras angulares para las herramientas de modelado de negocios, herramientas de minería de datos y herramientas de informes de rendimiento.
- Permite a los usuarios cortar datos de cubos y dados, todo de acuerdo con diferentes dimensiones, medidas y filtros.
- Es bueno analizar series de tiempo.
- Es fácil encontrar varios clústeres y salidas con OLAP.
- Es un potente sistema de proceso analítico visualizado en línea que proporciona tiempos de respuesta más rápidos.
Desventajas de OLAP
- OLAP requiere organizar los datos en un esquema en estrella o en un ala de nieve. Estos esquemas son complejos de implementar y administrar.
- No puede tener una gran cantidad de dimensiones en un solo cubo OLAP
- No se puede acceder a los datos de transacciones con el sistema OLAP.
- Cualquier modificación en el cubo OLAP requiere una actualización completa del cubo. Este es un proceso que requiere mucho tiempo
Resumen:
- OLAP es una tecnología que permite a los analistas extraer y ver datos comerciales desde una variedad de perspectivas.
- En el corazón del concepto OLAP se encuentra el Cubo OLAP.
- Varias aplicaciones comerciales y otras operaciones de datos requieren el uso de un cubo OLAP.
- Hay cinco tipos principales de operaciones de análisis en OLAP 1) Desplazamiento 2) Profundización 3) Rebanada 4) Dados y 5) Pivote
- MOLAP, ROLAP y OLAP híbrido son tres tipos de sistemas OLAP ampliamente utilizados.
- Otros tipos de sistemas OLAP son OLAP Desktop, Web OLAP y Mobile OLAP.