Data Warehouse y Business Activity Monitoring. El nuevo escenario

Las soluciones de Inteligencia de Negocios (BI) nos permiten visualizar, analizar, comunicar y hasta predecir el comportamiento de nuestro negocio. Pero debemos recordar que lo que habilita todas estas capacidades, es la información. Típicamente, esta información reside en lo que conocemos como data warehouses. Sin embargo, conforme las arquitecturas de software se van orientando a servicios y centrando en procesos —a diferencia de en datos—, también aumenta el rol que juegan los sistemas de Business Activity Monitoring (BAM) como fuente de información en tiempo real sobre la operación de negocio. Adicionalmente, se introducen los Enterprise Service Bus (ESB) como gestor de integración de la información.

Repasemos entonces lo que es un data warehouse, y a lo largo del artículo iremos viendo su evolución bajo este nuevo escenario.

Data Warehouse
Como sabemos, un data warehouse (DW) es, a fin de cuentas, una base de datos. Sin embargo, la diferencia fundamental entre ésta y una base de datos operacional, es el propósito con el que se utilizan sus datos. La razón de ser de una base de datos operacional, es habilitar la operación del negocio. En cambio, el propósito de un data warehouse es que sus datos puedan ser analizados, para así obtener conocimiento y soportar la toma de decisiones estratégicas.

Recordemos que a principios de la década del noventa, las empresas comprendieron que a pesar de que el procesamiento de las bases de datos operacionales era muy valioso y ayudaba a optimizar los procesos, no podía predecir comportamientos ni realizar análisis complejos. Poseían datos de gran valor, pero éstos estaban dispersos y con una visión diferente en cada caso. Fue entonces que nació el concepto del data warehouse, como una colección de datos orientados a un tema, integrados, históricos y no volátiles como soporte para la toma de decisiones.

En el transcurso de los últimos años, ha cambiado radicalmente la forma de almacenar la información. Los modelos de datos son útiles para predecir el valor de ciertos valores a partir de otros datos; se realiza una clasificación, empezando por los atributos más significativos hasta terminar por los menos significativos. De esta manera es posible establecer una serie de reglas sobre qué factores o atributos afectan a cada caso del modelo, y así tener una base a partir de la cual estimar cómo responderán otros casos en el futuro.

Herramientas para DW
Existen diversas herramientas para la creación y mantenimiento de data warehouses. Por ejemplo, algunas de las tecnologías disponibles permiten extender funcionalidades habituales y manejar cubos u otros modelos de indexación que dan acceso rápido y eficiente a los datos sin sacrificar demasiado espacio en disco. Hay un concepto que se llama Bitmap Index que es un modelo de indexación muy eficiente que da acceso directo a datos específicos. Otra tecnología clave se llama Data Partitioning y permite particionar los datos por meses o por años y evita tener que barrer las tablas completas para buscar algo y sólo hay que ir a esas particiones específicas.

Una vez resuelto el tema del consolidado de información, que es dónde se guardan los datos y cómo se les llama, la tarea es crear el modelo adecuado. Existen herramientas que facilitan esta actividad, ya que el modelado se reealiza de manera gráfica, y desde las mismas herramientas es posible generar los enlaces para establecer desde que fuentes de datos se va a traer la información que alimentará al warehouse. Un ejemplo de una de estas herramientas es el Oracle Warhouse Builder.

Integración, Clave para el Éxito
Muchos todavía recuerdan que uno de los grandes problemas del data warehousing en sus comienzos era el de la integración. Esto provoca que aún hoy se piense que son necesarias inversiones cuantiosas para poder enfrentar las exigencias que requiere integrar los datos.

En ese entonces, no bastaba con tener el manejador de base de datos más robusto del mercado, porque la problemática era traer los datos que corrían sobre otros sistemas para poder consolidarlos posteriormente. Esto estaba ligado a tecnologías propietarias que hacían el emprendimiento muy costoso. De esta forma, hubo clientes que se vieron obligados a gastar todo su presupuesto y aún más para implantar su warehouse con datos integrados.

En las arquitecturas orientadas a servicios, la integración de información promete ser una tarea más sencilla y transparente. Es aquí que surge el concepto del Enterprise Service Bus (ESB). Existen muchas definiciones de un ESB, pero podemos verlo como una infraestructura de middleware que habilita y gestiona la comunicación —basada en estándares como web services, XML y otros— entre componentes aplicativos heterogéneos.

De Datos Hacia Procesos
Cuando las empresas reconocen que la información puede ser generadora de negocios, comienzan a salir de los datos tradicionales y buscan tomar decisiones en base a imágenes, documentos de todo tipo y demás elementos; no sólo con base en datos sino en procesos completos. Es aquí donde entran las soluciones de Business Process Management, y en particular el componente de Business Activity Monitoring (BAM), o monitoreo de actividades de negocio. Como hemos visto en artículos anteriores de esta revista (ver Año 1 No. 4), los sistemas BPM (BPMS) permiten modelar los procesos de negocio como tales, para que puedan ser ejecutados por un motor de procesos, y monitoreados a través de un componente BAM, con el cual se puede acceder no sólo a los históricos, sino también a las instancias de procesos en tiempo real, es decir, conforme se están ejecutando.

Si años atrás se aspiraba a un just in time, bajo el modelo de BAM se puede visualizar que toda la cadena de producción esté funcionando bajo el formato del “justo a tiempo”. Si durante la ejecución de los procesos de negocio se da alguna falla, el BAM nos permite saber exactamente cuál fue el punto del proceso donde está la falla, así como las razones de ésta.

Adicionalmente, esta capacidad nos permite apostar por una estrategia basada en un producto o servicio específico en un determinado mercado, y en lugar de tener que esperar varias semanas para conocer los resultados, se puede monitorear todo en tiempo real, y corregir o adaptar la estrategia, en caso de ser necesario.

La figura 1 muestra los diferentes elementos que pueden conformar una solución de “BI Unificado”, bajo el escenario descrito en este artículo. Este caso particular está ejemplificado con productos de Oracle, pero es posible utilizar herramientas de distintos proveedores para cada caso. A fin de cuentas, esta capacidad es una de las grandes ventajas de las arquitecturas abiertas y orientadas a servicios.

Figura 1. Ejemplo de Arquitectura moderna de BI

Acerca de autor
Miguel Cruz es responsable del área de Tecnología en Oracle México, donde ha laborado por más de 12 años. Anteriormente laboró en el Centro de Desarrollo Mecánico e Innovación Tecnológica de la UNAM, desarrollando proyectos de Investigación en programas de vinculación entre el sector Académico y la Iniciativa Privada. Miguel es Ingeniero en Computación de la Facultad de Ingeniería de la UNAM y cuenta con un MBA por parte del ITAM.