IBM y Big Data

Publicado en

[Contenido Patrocinado]

El mundo tecnológico se encuentra en constante cambio, y cada vez los retos relacionados al análisis de la información implican un mayor potencial en la infraestructura. A través de los avances en cuanto a tecnología de comunicaciones, las personas y las cosas se encuentran cada vez más interconectadas la mayor parte del tiempo, además mediante la instrumentación ahora somos capaces de medir y detectar información relevante para nuestras operaciones del día a día.

¿Pero qué sucede cuando las organizaciones se encuentran con información que no puede ser procesada o analizada por procesos o herramientas tradicionales, o bien, no conocen cómo obtener el valor de los datos provenientes de diversas fuentes (que pueden ser estructuradas o no estructuradas), y más aún si la velocidad y cantidad de información es generada a tasas de crecimiento extremadamente altas?, la respuesta a esta problemática está relacionada con el concepto de Big Data. [1]

Figura 1. Retos de Big Data

 

Datos almacenados y datos en movimiento

Basado en el poder de Apache Hadoop, IBM InfoSphere BigInsights™ [2] permite analizar y descubrir efectivamente una nueva perspectiva de la información que se encuentra almacenada de manera estática (at rest) en grandes volúmenes de datos (Terabytes / Petabytes / Zetabytes), tales como bitácoras, rss feeds, blogs, sitios de redes sociales, datos de sensores, e-mails, mensajes instantáneos, etcétera. IBM InfoSphere BigInsights complementa la infraestructura existente de administración de la información, extendiendo las capacidades analíticas para incluir un gran volumen de datos en constante cambio.

Mientras que BigInsights nos permite obtener toda la ventaja competitiva para tratar con aquellos “mares” de información, IBM InfoSphere Streams™ proporciona un mejor entendimiento de aquellas “cascadas” de información que se encuentran fluyendo en constante movimiento (in-motion) permitiendo capturar y actuar sobre aquellos datos de negocio todo el tiempo en el momento preciso. IBM InfoSphere Streams es una plataforma de alto desempeño en la cual las aplicaciones rápidamente pueden obtener, analizar y correlacionar toda la información proveniente de miles de fuentes en tiempo real; todo esto de forma continua en un orden de petabytes al día, ejecutando analíticos complejos de varios tipos de datos como texto, imágenes, audio, video, escáneres, sensores, e-mail, datos GPS, transacciones financieras, datos satelitales y cualquier tipo de información digital relevante para cada organización.

 

El patrón redes sociales

Tal vez el uso más mencionado de Big Data es el análisis de redes sociales y análisis de los sentimientos de los clientes. Big Data puede ser utilizado para analizar lo que sus clientes están hablando sobre su organización (y quizás lo que opinan de la competencia), y de esta manera determinar el impacto en la toma de decisiones empresarial.

El análisis de redes sociales es un tema con impacto real en la vida de las organizaciones, al grado que IBM ha construido una solución específicamente para este uso: Cognos Consumer Insights (CCI), es una solución que es ejecutada sobre BigInsights que demuestra las tendencias de los medios sociales que son analizados.

 

Big Data en la nube

Una plataforma de Big Data es grandiosa al obtener el valor de grandes volúmenes de información, sin embargo para lograrlo es también necesario contar con una infraestructura de cómputo escalable además de disponer de suficiente espacio para su almacenamiento, por lo que a muchas organizaciones les es imposible hacer frente a una inversión de capital en cuanto a recursos, almacenamiento y dispositivos de redes. IBM InfoSphere BigInsights cuenta con la disponibilidad de instalar y desplegar la plataforma en una arquitectura basada en cómputo en la nube sobre IBM SmartCloud Enterprise™ adicional a las nubes privadas.

 

Liderazgo reconocido

Recientemente IBM fue seleccionada como parte de las empresas evaluadas dentro del estudio de Forrester Research sobre soluciones Big Data (The Forrester Wave™: Enterprise Hadoop Solutions, Q1 2012). El estudio reporta que IBM fue posicionada en la categoría de líderes con los más altos resultados en los segmentos de estrategia y presencia en el mercado.

 

Ventajas de la plataforma IBM

Al enfrentar la problemática que representan las “3 V’s” de big data – volumen, velocidad y variedad – la plataforma de IBM ofrece 4 ventajas competitivas:

Big data en tiempo real

  1. InfoSphere Streams es distinto a cualquier plataforma en su habilidad de obtener, analizar y actuar sobre datos en movimiento (in motion) —los cuales son procesados y analizados en latencias de sub-milisegundos.

Amplia gama de analíticos

  1. Motores analíticos que permiten operar una gran variedad de análisis como bitácoras, registros de llamadas telefónicas, redes sociales, sentimiento del cliente, fidelidad del cliente y más.

Clase empresarial

  1. La plataforma basada en Hadoop, BigInsights, provee de la habilidad para analizar y extraer información de una amplia variedad de fuentes de datos, promueve la exploración de datos y el descubrimiento mientras extiende las funciones existentes de su data warehouse.
  2. La capacidad de integración de la información provee de funciones de transformación de datos, gobernabilidad y administración de metadatos tanto para datos en movimiento (in motion) como estáticos (at rest).
  3. Todas estas capacidades están diseñadas para que sean consumidas por usuarios finales, administradores y desarrolladores de aplicaciones.        

Integración

  1. Existen más de 100 aplicaciones muestra recolectadas del trabajo que se ha realizado en IBM para casos de uso e industrias específicas. Estos aplicativos están implementados dentro de la solución de manera que las organizaciones puedan dedicar su tiempo a analizar y no a implementar.
  2. La solución de IBM está constituida por una vasta lista de conectores hacia componentes principales, de modo que puedan integrarse rápidamente hacia cualquier infraestructura empresarial.

 

 

Al contrario de lo que muchas personas piensan, Big Data no es un concepto nuevo, lo que si es reciente es la fuerte penetración y atención que está tomando actualmente en el mercado. IBM ha investigado e invertido fuertemente en este campo por varios años, y ha creado una plataforma de Big Data completamente diseñada para ayudar a las organizaciones a adoptar estos cambios y recolectar toda la información crítica mediante su iniciativa “Smarter Planet”, reconociendo que nuestro planeta es ahora más instrumentado, interconectado e inteligente.

Si desea más información sobre Big Data y las soluciones de IBM, por favor envíe un correo electrónico a: Ricardo Barranco Fragoso (rbarran@mx1.ibm.com).

Figura 2. Panorama de la plataforma para Big Data de IBM

Referencias

[1] IBM. “Bringing Big Data to the Enterprise”. http://www-01.ibm.com/software/data/bigdata

[2] IBM. “Infosphere BigInsights”. http://www-01.ibm.com/software/data/infosphere/biginsights

 

 

Bio

Ricardo Barranco es IT Specialist para Information Management en IBM México. rbarran@mx1.ibm.com