Publicado en
Autor
Hoy en día las organizaciones luchamos para obtener una perspectiva de negocio a partir del gran volumen de datos que generamos día a día. Para nuestras organizaciones, el principal desafío es aprender cómo procesar eficazmente todos estos tipos de datos sin la carga de la creación de almacenamiento distribuido complejo y clusters de cómputo.
Con el fin de generar una ventaja competitiva, las organizaciones buscan una forma eficaz de combinar los datos que generamos internamente con los que se producen externamente —principalmente en las redes sociales— y generar con la combinación de ambos, conocimientos que nos lleven a servir mejor a nuestros clientes actuales y generar nuevas oportunidades de negocio.
Antecedentes
Antes de proseguir, revisemos algunos de los factores que mayor impacto tienen en la forma en la que estamos administrando nuestra información.
- El crecimiento anual del volumen de información en la red es de 59% y sigue en aumento.
- El grueso de estos datos son no estructurados. El requisito para almacenar y analizar datos estructurados y no estructurados juntos se ha convirtiendo en una nueva norma para las organizaciones.
- El cómputo en la nube y el hardware han reducido radicalmente el costo de adquisición para la capacidad de cómputo y almacenamiento. Esto está cambiando fundamentalmente la economía para el procesamiento de datos.
Nuevas capacidades
Complementando a los factores previamente mencionados, las organizaciones se ven en la necesidad de procesar, analizar y visualizar los datos conforme se generan.
Las empresas que quieren impulsar su “Big Data IQ” necesitan tener la capacidad de analizar datos a medida que están siendo generados y luego tomar la acción apropiada. Esto busca entregar resultados de entendimiento de mercado antes de que el de dato se almacene, es decir analizar los tipos de datos en movimiento (streaming) y derivar en el análisis de los mismos.
Para dar visibilidad al negocio de lo que el mercado necesita, con los datos que fluyen a través de nuestra organización, debemos aprovechar los datos ganando tiempo para obtener ventajas competitivas en nuestro negocio. Aquí es donde entran en juego soluciones para análisis de datos en movimiento que permiten aprovechar las técnicas de procesamiento para análisis de datos en tiempo real y así tomar acciones contra nuestros competidores y mejores decisiones de negocio.
Analizados los datos enfrentamos el reto de la visualización. Donde no solo debemos considerar la integración de datos estructurados y no estructurados sino también una visualización del análisis que sea rápida, confiable y simple para todas las áreas del negocio.
Nuevas tecnologías
En los últimos años han surgido nuevas tecnologías para poder hacer frente a estos retos. Posiblemente la más conocida es Hadoop, un framework open source para el procesamiento masivo de datos. Hadoop está diseñado para responder a las necesidades modernas de almacenamiento y análisis de enormes volúmenes de datos no estructurados bajo un modelo económicamente rentable.
Hay que tener en cuenta que Hadoop es un framework poderoso pero complejo, así que recomendamos que busque una solución que facilite la instalación y administración de Hadoop, haciéndolo más accesible a los usuarios. También tome en cuenta elementos como la integración con su infraestructura existente, gestión de seguridad, y la posibilidad de desplegarse en escenarios híbridos de data center y la nube.
Recomendaciones
Al comenzar una iniciativa de big data, nuestra misión debe ser ayudar a los usuarios a obtener información de nuestro negocio prácticamente con todos los datos. Para lograrlo, debemos tener una estrategia integral que ofrezca:
- Una capa de administración de datos moderna que soporte todos los tipos de datos en reposo o en movimiento.
- Una capa de beneficios completa que mejora los datos a través del descubrimiento, combinándolo con los datos del mundo y refinándolos con análisis avanzados.
- Una capa de Inteligencia que proporcione información a todos los usuarios de negocio a través de herramientas confiables en tiempo real.
Nuestra decisión entonces para una plataforma Big Data debe incluir las tendencias, tecnologías y la promesa de las organizaciones en generar ideas reales con datos estructurados y no estructurados para habilitar el obtener mayor valor comercial y económico de nuestros activos de datos.
Janet Amezcua Rogel es especialista en Plataformas de Datos e Inteligencia de Negocios de Microsoft México. Otras de sus especialidades son la administración de bases de datos, los sistemas en tiempo real y el cómputo de alto desempeño. janet.amezcua@microsoft.com
Miguel Chanona Carmona es gerente de producto para Plataformas de Datos e Inteligencia de Negocios de Microsoft México. miguel.chanona@microsoft.com
- Log in to post comments