Metodologías de Data Warehouse

Al diseñar una solución de Data Warehouse, las organizaciones se topan con distintas metodologías y enfoques a seguir, las cuales se deberán evaluar para seleccionar la que mejor se adapte a los requisitos del proyecto. Las siguientes metodologías fueron diseñadas por Ralph Kimball, Bill Inmon y Dan Linsted correspondientemente.

Enfoques de Diseño Botton Up y Top Down

Antes de seleccionar de entre las diversas metodologías de un Data Warehouse, se deben de considerar los 2 tipos de enfoques diseño existentes: Bottom Up y Top Down.

Dichos enfoques pueden proporcionar una mejor coherencia lógica, mayor consistencia en los Data Marts, así como diferentes ventajas y desventajas.

Botton Up (Ascendente)

Enfoque de  diseño ascendente del reconocido Ralph Kimball. Aquí los Data Marts son los primeros en crearse, se dirigen a una sola área y proporcionan una pequeña visión de los datos de la organización. Después de haberse creado los Data Marts se integran al Data Warehouse creando un almacenamiento más completo, por medio del “BUS de Data Warehouse“.

Ventajas:

  • Este enfoque proporciona la capacidad de generar informes.
  • Facilita la ampliación al momento de agregar nuevas unidades de negocio.
  • Menor tiempo de desarrollo. Su configuración es más rápida.

Desventajas:

  • El costo inicial es bajo, pero al iniciar con las siguientes fases el costo llegará a incrementar.
  • Sujeto a revisiones constantes, lo que lo vuelve difícil de mantener.

Top Down (Descendente)

Enfoque descendente de Bill Inmon reconocido como “El padre del Data Warehouse”, este construye primero el Data Warehouse y en base a el se crean los Data Marts. Ubicando en el centro de la información corporativa el Data Warehouse lo que asegura un marco lógico.

Ventajas:

  • La estructura es más fácil de mantener.
  • Da vistas dimensionales coherentes, al cagar los Data Marts desde el Data Warehouse.
  • Coso inicial alto, pero el costo de desarrollo baja considerablemente.

Desventajas:

  • Requiere de personas calificadas para la configuración.
  • La configuración inicial requiere mayor tiempo.

METODOLOGÍAS DE DATA WAREHOUSE

Dimensional

La metodología dimensional o metodología de Ralph Kimball, se centra en un enfoque ascendente, principalmente en el valor del almacenamiento de datos para los usuarios lo más rápido posible. Según Kimball, un almacenamiento de datos es la copia de los datos transaccionales específicamente estructurados para consultas analíticas e informes con el fin de apoyar el sistema de apoyo a la toma de decisiones. Con base a su metodología, se crean primero los Data Marts para proporcionar capacidades analíticas y de informes para procesos específicos de negocio y funcionales, por consiguiente pueden establecerse juntos para conseguir un almacenamiento de datos completo.

Kimball, propone crear una matriz de negocio que contenga los elementos comunes que son utilizados por los Data Marts, como conformed-shared dimension, measures, etc., teniendo esta información, el usuario podrá desarrollar soluciones que apoyen el análisis a través de los procesos de negocio para la venta cruzada.

 


Relational

La metodología de Bill Inmon comienza con el diseño del modelo de datos empresariales, se identifican las principales áreas y entidades con las que trabaja la empresa, ya sea como cliente, producto, proveedor, etc.

El enfoque del diseño de esta metodología utiliza la forma normalizada para crear la estructura de entidades, evitando la repetición de datos, tanto como sea posible. En pocas palabras, una identificación clara de los requisitos empresariales y la prevención de cualquier irregularidad en la actualización de datos.

A continuación, se construye el modelo físico, que sigue la estructura normalizada. Este modelo crea una única fuente de verdad para todo el negocio. La carga de datos se vuelve menos compleja debido a la estructura normalizada del modelo. Sin embargo, el uso de esta disposición para realizar consultas, es complicado, ya que incluye gran cantidad de tablas y vínculos.

Este modelo propone la construcción de Data Marts por separado para cada departamento. Todos los datos que entran en el almacén de datos están integrados. Para garantizar la integridad y la coherencia en toda la empresa, el Data Warehouse actúa como un único origen de datos para varios Data Marts.

 


Data Vault

Es una metodología de seguimiento histórico orientado a los detalles y conjunto de tablas normalizadas vinculadas de forma única que admiten uno o más áreas funcionales de negocios. Es un modelo de datos que está diseñado específicamente para cumplir las necesidades de uno o varios Data Warehouse empresariales de hoy en día.

Ventajas

  • Diseñado especialmente para almacenar registros. Hace que el proceso de registro de datos sea más sencillo.
  • Con esta metodología, es más fácil agregar un nuevo origen de datos sin modificar el ya existente.
  • Automatiza fácilmente los procesos ETL.

Arquitectura de Data Vault

Data Vault contiene tres tablas básicas:

  • Hub
  • Links
  • Satellites

 


¿Qué metodología de Data Warehouse es la mejor?

A pesar de las diferencias de enfoque e ideas de cada metodología es imposible decir que una es mejor que la otra. Puesto que la que se adecua para las organizaciones siempre será la que mejor encaje a las necesidades de su organización según la infraestructura del almacén de datos o del cubo.

Visto: 734 veces

Deja un comentario