Metodologías de Data Warehouse

Existen diferentes metodologías para seguir al diseñar una solución de Data Warehouse y referente a la función de los requisitos de su proyecto puede elegir la que mejor se adapte a su requerimiento. Estás metodologías fueron diseñadas por Ralph Kimball, Bill Inmon y Dan Linsted.

Dimensional

La metodología dimensional o metodología Kimball, se centra en un enfoque ascendente, principalmente en el valor del almacenamiento de datos para los usuarios lo más rápido posible. Según Kimball, un almacenamiento de datos es la copia de los datos transaccionales específicamente estructurados para consultas analíticas e informes con el fin de apoyar el sistema de apoyo a la toma de decisiones. Con base a su metodología, se crean primero los data marts para proporcionar capacidades analíticas y de informes para procesos específicos de negocio y funcionales, por consiguiente pueden establecerse juntos para conseguir un almacenamiento de datos completo.

Kimball, propone crear una matriz de negocio que contenga los elementos comunes que son utilizados por los data marts, como conformed-shared dimension, measures, etc., teniendo esta información, el usuario podrá desarrollar soluciones que apoyen el análisis a través de los procesos de negocio para la venta cruzada.

 


Relational

La metodología de Bill Inmon comienza con el diseño del modelo de datos empresariales, se identifican las principales áreas y entidades con las que trabaja la empresa, ya sea como cliente, producto, proveedor, etc.

El enfoque del diseño de esta metodología utiliza el formulario normalizado para crear la estructura de entidades, evitando la repetición de datos, tanto como sea posible. En pocas palabras, una identificación clara de los requisitos empresariales y la prevención de cualquier irregularidad en la actualización de datos.

A continuación, se construye el modelo físico, que sigue la estructura normalizada. Este modelo crea una única fuente de verdad para todo el negocio. La carga de datos se vuelve menos compleja debido a la estructura normalizada del modelo. Sin embargo, el uso de esta disposición para realizar consultas, es complicado, ya que incluye gran cantidad de tablas y vínculos.

Este modelo propone la construcción de data marts por separado para cada departamento. Todos los datos que entran en el almacén de datos están integrados. Para garantizar la integridad y la coherencia en toda la empresa, el almacenamiento de datos actúa como un único origen de datos para varios data marts.

 


Data Vault

Es una metodología de seguimiento histórico orientado a los detalles y conjunto de tablas normalizadas vinculadas de forma única que admiten uno o más áreas funcionales de negocios. Es un modelo de datos que está diseñado específicamente para cumplir las necesidades de uno o varios data warehouse empresariales de hoy en día.

Ventajas

  • Diseñado especialmente para almacenar registros. Hace que el proceso de registro de datos sea más sencillo.
  • Con esta metodología, es más fácil agregar un nuevo origen de datos sin modificar el ya existente.
  • Automatiza fácilmente los procesos ETL.

Arquitectura de Data Vault

Data Vault contiene tres tablas básicas:

  • Hub
  • Links
  • Satellites

 

¿Qué metodología de Data Warehouse es la mejor?

A pesar de las diferencias de enfoque e ideas de cada metodología es imposible decir que una es mejor que la otra. Puesto que la que se adecua para las organizaciones siempre será la que mejor encaje a las necesidades de su organización según la infraestructura del almacén de datos o del cubo.

 

Visto: 60 veces

Deja un comentario