Modelos de datos en BI (Business Intelligence)

Publicado por

Cuando se habla de modelos de datos en BI (Business Intelligence), es muy común que nos vengan a la mente las herramientas que se utilizan para implementarlo, sin embargo el concepto de modelos de datos en BI va más allá de esto.

Es necesario seguir una metodología y tipos de modelo específicos para esta clase de soluciones, que permitan sacar el mejor provecho y beneficio a nuestra solución final.

Las preguntas del negocio

Para comenzar a realizar un modelo de datos en BI, es importante conocer el propósito de la información que se va a analizar, por consiguiente, el negocio.

A partir de allí, se utiliza esta información como base de nuestro modelo dimensional, que permita responder las preguntas relacionadas al negocio.

Por ejemplo:

  • ¿Cuánto dinero se produce en ventas anualmente?
  • ¿Cuál sucursal de mi negocio tiene la mayor venta mensual?
  • ¿Cuántos ingresos genera el producto que más vende mi negocio?
  • ¿Cuál es mi top 5 de productos que generan las mayores ganancias?
  • ¿Cuáles son los empleados con mayores ventas por sucursal?
  • Respecto al año anterior, ¿Cómo han variado mis ventas por producto y sucursal?

Estas preguntas nos van a ayudar a delimitar el alcance de nuestro modelo y entender mejor los requerimientos del negocio.

Serán pieza clave para enfocar nuestro modelo de datos en BI hacia un Data Mart (DM) o Data Warehouse (DW), dependiendo de la magnitud y áreas a considerar.

¿Hechos y dimensiones?

Ya tenemos nuestras preguntas del negocio, pero para hacer modelos de datos en BI, es necesario convertirlas en la base para transformar nuestros datos en información.

¿Cómo?… pues ahora entramos en los famosos conceptos de «Hechos» y «Dimensiones«.

Hechos

Los hechos en los modelos de datos en BI se los puede definir como uno o varios eventos dentro del negocio que se requieren registrar, como por ejemplo, las ventas.

A diferencia de un modelo de datos relacional normalizado, en BI se busca exactamente lo opuesto, es decir, necesitas desnormalizar la información.

Esto, con el propósito de facilitar y optimizar el proceso de consultas al modelo final, desde del punto técnico y desde la perspectiva del entendimiento del usuario final.

La tabla de «hechos» que resulta de este proceso, debe considerar las métricas en la mínima expresión que se requiera para su análisis posterior (granularidad).

Además, debe incluir identificadores de negocio únicos para relacionarla con las «dimensiones» (atributos de entidades relacionadas al hecho) del modelo.

Dimensiones

Una dimensión se puede definir como la perspectiva de análisis del hecho del modelo de datos en BI.

Se puede explicar sencillamente, siguiendo el ejemplo de las preguntas del negocio respecto a las ventas.

Preguntas para modelos de datos en BI. Por ejemplo: ¿Cuánto dinero se produce en ventas anualmente? El hecho serían las ventas, y la dimensión el tiempo, haciendo referencia a la palabra "anualmente"

La dimensión en esta pregunta tiene relación con el tiempo en el que se desarrolla el hecho, es decir, es la perspectiva de análisis que se utiliza para evaluar el dinero que se produce en ventas.

A diferencia de los hechos, las dimensiones solamente consideran los atributos de las entidades que los describen, teniendo registros únicos y con historia limitada.

Tipos de modelos

Los modelos de datos en BI, se consideran básicamente de dos tipos: Modelo en estrella y Modelo en copo de nieve.

Modelo de datos en estrella

Modelo dimensional en estrella
Modelo dimensional en estrella

Este tipo de modelo se basa en una tabla central que contiene el hecho concepto de análisis (tabla de hecho), los campos id que la relacionan con las tablas de dimensiones y los cálculos relacionados al hecho en la mínima granularidad requerida.

Este modelo se considera el ideal para utilizar en conjunto con herramientas de visualización de datos, ya que facilita el filtrado de los datos.

Ahora bien, desglosaremos un poco el concepto con el caso práctico que hemos venido desarrollando.

Utilizaremos la preguntas del negocio para entender las dimensiones que necesitamos en relación al hecho de las ventas:

Preguntas para modelos de datos en BI
Preguntas para modelos de datos en BI

Una vez tengamos las dimensiones relacionadas al hecho, podemos diseñar un modelo de datos dimensional para nuestro caso:

Modelo en estrella

Modelo de datos en copo de nieve

Este tipo de modelo es más complejo que un modelo en estrella, pero el concepto de creación parte de la misma base de análisis.

Se presenta cuando las dimensiones tienen más de una tabla para conformarla, y el objetivo es básicamente disminuir el almacenamiento con la normalización de estas tablas.

Bajo este modelo, la tabla de hecho no está relacionada directamente a todas las tablas que componen el modelo de datos.

Siguiendo nuestro ejemplo, podríamos considerar entonces el siguiente esquema de modelado en copo de nieve:

Modelo en copo de nieve

¿Cuál modelo de datos en BI debería utilizar?

Cada tipo de modelo tiene sus ventajas y desventajas, y va a depender del escenario de negocio y de disponibilidad de recursos de hardware y software que dispongas, la respuesta a la interrogante.

Por ello, te dejamos a continuación un tabla comparativa entre ambos modelos de datos en BI:

Concluyendo

Este artículo explica los conceptos más importantes sobre los modelos de datos en BI, haciendo énfasis en las ventajas y desventajas de cada uno.

Espero que les resulte de utilidad, y nos estaremos leyendo en próximas entradas.

Te invito a leer nuestros artículos, y visitar nuestro canal de YouTube NotJustBI, pueden ser de gran interés para tí!

Por favor, si tienes algún comentario, duda o sugerencia, no dudes en contactarnos a través de nuestro correo: info@notjustbi.com

Un comentario

Deja un comentario