Introducción a PENTAHO (parte 1 de 2)

PENTAHO es un proyecto iniciado por una comunidad OpenSource, provee una alternativa de soluciones de BI en distintas áreas como en la Arquitectura,  Soporte, Funcionalidad e Implantación.  Estas soluciones al igual que su ambiente de implantación están basados en JAVA, haciéndolo flexible en cubrir amplias necesidades empresariales.A través de la integración funcional  de diversos proyectos de OpenSource permite ofrecer soluciones en áreas como: Análisis de información, Reportes,  Tableros  de mando conocido como “DashBoards”, Flujos de Trabajo y Minería de Datos.

Para facilitar la comprensión y proveer una clasificación manejable sobre los diversos elementos que  determinan el entorno PENTAHO, hemos definido seis temas fundamentales de los cuales describiremos a manera de introducción en esta publicación:

Clasificación PENTAHO

PLATAFORMA BI

Compuesta por componentes OpenSource provee la arquitectura y la Infraestructura a la vez. Forma un proceso centralizado bajo un marco de trabajo orientado a la solución de problemas empleando componentes de BI y permitiendo desarrollos completos para atender a soluciones de Inteligencia de Negocios.�
En resumen  la  PLATAFORMA BI integra componentes OpenSource mostrando una combinación de flujos de trabajo y administración de procesos.En la siguiente ilustración se muestra la arquitectura funcional de PENTAHO:

Arquitectura Funcional PENTAHO

HERRAMIENTAS Y AREAS DE APLICACIONES

Bajo la integración de otros proyectos OpenSource que brindan funcionalidad en áreas de BI, la comunidad PENTAHO trabaja en formalizar estas herramientas y formar el SUITE BI.

Mondrian Logo

Ahora bautizado como “Pentaho Analysis Service” forma parte del motor OLAP integrado en el SUITE BI de PENTHO
Un ejemplo rápido sobre el  flujo de datos es:

1. El cliente manda una solicitud de consulta bajo la interfaz web JPivot
2. Mondrian recibe la solicitud y bajo el esquema de metadatos que definen sus conceptos multidimensionales busca si ya tiene los datos en cache respondiendo rápidamente a la petición.
3. Si los datos no se encontraron en cache ejecuta las sentencias SQL para generar los datos.
4. Se almacenan los datos recibos en cache para agilizar posteriores consultas.
5. Y finalmente se devuelve el resultado al usuario cliente a través de la interfaz.

Flujo Datos Mondrian

Reporting Logo JFreeReport / Pentaho Reporting:

Herramienta de Reportes flexibles y con clase empresarial, de escritorios o basados en Web. La herramienta de reportes PENTAHO permite comenzar desde sencillos reportes iníciales hasta formar complejos reportes ajustados a tus necesidades de negocio.

Ejemplo Reportes

Kettle Logo Kettle “Pentaho Data Integration”

Por sus siglas en ingles “K Extraction Transformation Transportation Load E”
Usando una interface grafica “SPOON” permite diseñar “jobs” de transformación de datos para ser procesados bajo las herramientas de Kettle (PAN y KITCHEN).

PAN es un motor de transformación de datos permitiendo la lectura y escritura sobre diversas fuentes de datos.
KITCHEN es una aplicación que permite ejecutar “Jobs” planificados en modo “batch” (serie, lote) para correr automáticamente en intervalos de tiempo definidos.

Weka Animal Weka: Minería de Datos

Provee un completo conjunto de algoritmos que automatizan los procesos de transformación de datos a la forma en que la minería de datos puede explotarlos. Los resultados pueden ser visualizados en modo grafico ya sea agrupado, segmentado, de árbol de decisión, bosque aleatorio, redes neurales y componentes de análisis.
Utiliza filtros para la discreción, normalización, re-muestreo “re-sampling”, selección y trasformación de atributos.
Maneja clasificadores proveyendo modelos para la predicción nominal o cantidades numéricas.

Visto: 66,034 veces

8 comentarios en “Introducción a PENTAHO (parte 1 de 2)

  1. Saludos Cordiales, me gustaria implementar toda esta tecnologia pero se me ha hecho realmente dificil poder ejecutarla, me gustaria saber si tienen algun tipo de información o material que me pueda servir para implementarlo. hasta ahora he podido implementar el Apache TomCat 5.5 y el mondrian, me gustaria que me pudiera ayudar con esto, de verdad muchas gracias por todo!!!!!

  2. Si lo que buscas es una demostración de toda la plataforma, te recomiendo que descargues la version demo, que trae los componentes incluidos, ademas de que corre en un solo click.

    Respecto a la documentacion de los componentes de Pentaho, se encuentran adjuntos dentro de la carpeta del mismo ejemplo.(Kettle-3.0.0-M2\docs\). Por lo general estos manuales hablan de la instalacion y una breve descripcion de los componentes (Ingles). Tambien puedes obtener informacion en los foros de la pagina de pentaho.

    Adicionalmente te comentamos, que en breve estaremos publicando más artículos acerca de los componentes de PENTAHO, sobre su instalación, uso, mejores prácticas, etc.

  3. Deseo implementar pentaho, aunque he tenido inconvenientes en su instalaci´´on que por fin superé, pero desearía saber en Colombia que posibilidades hay de capacitación

  4. En mi blog he colocado algo mas de informacion y un video de como realizar la instalacion.
    Saludos

  5. saludos, estoy implementado pentaho,y la verdad es algo complicado al comienzo, pero lo que realmente nesecito es sabre como integrar la herramienta weka mineria de datos a pentaho mineria de datos

  6. Necesito ayuda para hacer una conexión de Pentaho BI server con SAP y de Pentaho Report-Designer también con SAP. Alguien que me pueda ayudar…

  7. Tengo poco tiempo de estar con Python. Ahora estoy aprendiendo como hacer un reporte en Pentaho y correrlo desde Python. He buscado documentación, ejemplos en internet, pero no he podio encontrar nada. Parece que la parte de reportes de python es sumamente escasa.

    Gracias
    Mucho agradecería me pudieran ayudar.

Deja un comentario