Metodologías de Data Warehouse

Al diseñar una solución de Data Warehouse, las organizaciones se topan con distintas metodologías y enfoques a seguir, las cuales se deberán evaluar para seleccionar la que mejor se adapte a los requisitos del proyecto. Las siguientes metodologías fueron diseñadas por Ralph Kimball, Bill Inmon y Dan Linsted correspondientemente.

 

Dimensional

(BUTTON UP/ASCENDENTE)

La metodología dimensional o metodología de Ralph Kimball, mantiene un diseño ascendente por lo que los Data Marts son los primeros en crearse y después se integran al Data Warehouse creando un almacenamiento más completo.

Busca que el almacenamiento de datos de los usuarios se ejecute de la forma más rápida posible. Según Kimball, un almacenamiento de datos es la copia de los datos transaccionales específicamente estructurados para consultas analíticas e informes con el fin de apoyar la toma de decisiones. Con su metodología al crear primero los Data Marts se proporcionan capacidades analíticas y de informes para procesos específicos de negocio y funcionales.

Principales Diferenciadores:

  • Para mantener el Data Warehouse solo se requiere de un equipo pequeño de desarrolladores y arquitectos de datos.
  • Brinda buena funcionalidad para las métricas en cuanto al departamento y el seguimiento de KPI, al orientar los Data Marts a informes en cuanto a procesos de departamento o de negocios.

 

La metodología de Kimball, propone crear una matriz de negocio que contenga los elementos comunes que son utilizados por los Data Marts, como conformed-shared dimension, measures, etc., teniendo esta información, el usuario puede desarrollar soluciones que apoyen el análisis a través de los procesos de negocio para la venta cruzada.

Relacional

(TOP DOWN/DESCENDENTE)

La metodología relacional de Bill Inmon muestra un diseño descendente, donde se construye primero el Data Warehouse y por consiguiente los Data Marts. Ubicando el DW en el centro de la información corporativa lo que asegura un marco lógico en los datos.

Crear una estructura de entidades procurando que no se repitan datos.  Este modelo crea una única fuente de verdad para todo el negocio. La carga de datos se vuelve menos compleja debido a la estructura normalizada del modelo. Sin embargo, el uso de esta disposición para realizar consultas, es complicado, ya que incluye gran cantidad de tablas y vínculos.

Este modelo propone la construcción de Data Marts por separado para cada departamento. Todos los datos que entran en el Data Warehouse están integrados. Para garantizar la integridad y la coherencia en toda la empresa, el Data Warehouse actúa como un único origen de datos para varios Data Marts.

Principales Ventajas:

  • El Data Warehouse proporciona una única versión de la verdad, al ser el único origen de datos para los Data Marts.
  • Es para los usuarios comprender más fácilmente los procesos empresariales, ya que el modelo lógico representa entidades empresariales detalladas.
  • Resulta más fácil y menos propenso al fracaso el proceso de ETL, puesto que en la actualización de los datos las anomalías se evitan al contar con una redundancia muy baja.

 


Data Vault

Es una metodología de seguimiento histórico orientado a los detalles y conjunto de tablas normalizadas vinculadas de forma única que admiten una o más áreas funcionales de negocios. Es un modelo de datos que está diseñado específicamente para cumplir las necesidades de uno o varios Data Warehouse empresariales.

Ventajas

  • Diseñado especialmente para almacenar registros. Hace que el proceso de registro de datos sea más sencillo.
  • Con esta metodología, es más fácil agregar un nuevo origen de datos sin modificar el ya existente.
  • Automatiza fácilmente los procesos ETL.

Arquitectura de Data Vault

Data Vault contiene tres tablas básicas:

  • Hub
  • Links
  • Satélites

 


¿Qué metodología de Data Warehouse es la mejor?

A pesar de los distintos enfoques y propuestas de cada metodología, es imposible decidir que metodología es la mejor. Ya que los requerimientos de un proyecto en especifico serán realmente los que ayuden a definir que estructura es la que mejor se adecua al proyecto y la organización.

Visto: 1,400 veces

Deja un comentario