¿Qué es Pentaho?

Es un proyecto iniciado por una comunidad OpenSource, provee una alternativa de soluciones de BI en distintas áreas como en la Arquitectura, Soporte, Funcionalidad e Implantación.

 

Estas soluciones al igual que su ambiente de implantación están basados en Java, haciéndolo flexible en cubrir amplias necesidades empresariales. A través de la integración funcional de diversos proyectos de OpenSource permite ofrecer soluciones en áreas como: Análisis de información, Reportes, Tableros de mando conocido como “DashBoards”, Flujos de Trabajo y Minería de Datos.

Para facilitar la comprensión y proveer una clasificación manejable sobre los diversos elementos que determinan el entorno Pentaho, hemos definido seis temas fundamentales de los cuales describiremos a manera de introducción en esta publicación:

 

Plataforma BI

Compuesta por componentes OpenSource provee la arquitectura y la Infraestructura a la vez. Forma un proceso centralizado bajo un marco de trabajo orientado a la solución de problemas empleando componentes de BI y permitiendo desarrollos completos para atender a soluciones de Inteligencia de Negocios.
En resumen  la  Plataforma BI integra componentes OpenSource mostrando una combinación de flujos de trabajo y administración de procesos.En la siguiente ilustración se muestra la arquitectura funcional de Pentaho:

Herramientas y Áreas de Aplicaciones

Bajo la integración de otros proyectos OpenSource que brindan funcionalidad en áreas de BI, la comunidad Pentaho trabaja en formalizar estas herramientas y formar el Suite BI.

Mondrían (Pentaho Analysis Service)

Ahora bautizado como “Pentaho Analysis Service” forma parte del motor OLAP integrado en el Suite BI de Pentaho.
Un ejemplo rápido sobre el  flujo de datos es:

1. El cliente manda una solicitud de consulta bajo la interfaz web JPivot
2. Mondrian recibe la solicitud y bajo el esquema de metadatos que definen sus conceptos multidimensionales busca si ya tiene los datos en cache respondiendo rápidamente a la petición.
3. Si los datos no se encontraron en cache ejecuta las sentencias SQL para generar los datos.
4. Se almacenan los datos recibos en cache para agilizar posteriores consultas.
5. Y finalmente se devuelve el resultado al usuario cliente a través de la interfaz.

Pentaho Reporting

Herramienta de Reportes flexibles y con clase empresarial, de escritorios o basados en Web. La herramienta de reportes PENTAHO permite comenzar desde sencillos reportes iníciales hasta formar complejos reportes ajustados a tus necesidades de negocio.

KETTLE (K Extraction Transformation Transportation Load E)

Usando una interface grafica “SPOON” permite diseñar “jobs” de transformación de datos para ser procesados bajo las herramientas de Kettle (PAN y KITCHEN).

  • PAN es un motor de transformación de datos permitiendo la lectura y escritura sobre diversas fuentes de datos.
  • KITCHEN es una aplicación que permite ejecutar “Jobs” planificados en modo “batch” (serie, lote) para correr automáticamente en intervalos de tiempo definidos.
 Weka: Minería de Datos

Provee un completo conjunto de algoritmos que automatizan los procesos de transformación de datos a la forma en que la minería de datos puede explotarlos. Los resultados pueden ser visualizados en modo gráfico ya sea agrupado, segmentado, de árbol de decisión, bosque aleatorio y componentes de análisis. Utiliza filtros para la discreción, regularización, re-muestreo “re-sampling”, selección y trasformación de atributos.
Maneja clasificadores proveyendo modelos para la predicción nominal o cantidades numéricas.