¿Big Data podría convertirse en nuestro Big Brother?

Publicado en

Seguramente este es un artículo de Big Data que en el presente mes se suma a la cada vez más creciente cantidad de miles de artículos mensuales escritos sobre este tema en todos los medios, para todas las audiencias, en todos los idiomas, desde la academia, los proveedores, los analistas, los consultores y uno que otro “Fan” de la tecnología a nivel mundial; esto claramente nos dice que independientemente de lo que signifique, Big Data, éste es un término que ha inundado las mentes de todos nosotros.

Hace algún tiempo tuvimos la oportunidad de hablar de “Inteligencia de Negocios y su compleja simbiosis como “Mutualismo” para ayudarnos a tener un mejor desempeño empresarial y sus efectos positivos, al igual que sus contradicciones ya que muchas veces los “Negocios” muestran ir contra el concepto más puro de “Inteligencia Humana”, por ejemplo: comida chatarra vs diabetes juvenil, cigarrillos vs cáncer, alcohol vs accidentes, consumo energético vs efecto global de invernadero, etc.

En esta ocasión solo abordaremos el concepto Big Data en el ámbito de la “Inteligencia de Negocios”, CPM, BI, Predictive Analytics, EPM y aquellas técnicas, metodologías y herramientas que nos apoyan actualmente a tomar decisiones informadas por el uso extensivo de grandes volúmenes de datos, propios, públicos, comprados y en ocasiones hasta “prestados”.

Primeramente tomemos alguna de tantas definiciones de Big Data que existen, en este caso de Gartner Group:  “Big Data son los activos de información de alto volumen, alta velocidad, alta variedad de datos que demandan formas costo/efectivas e innovadoras de procesamiento de información para mejorar con un conocimiento profundo y apoyar la toma de decisiones” [1].

Se parece en su objetivo final a la definición de Inteligencia de Negocios…. pero en grande.

Básicamente lo que es bueno saber es que la iniciativa Big Data es parte de la evolución lógica de la tecnología de toma de decisiones y que no a todos sorprende dado que muchos de los componentes que hacen de esta tendencia una realidad hoy en día viene desde sus orígenes en BI, CPM, EPM, Data Mining y se ha empleado en Universidades, Centros de Investigación a nivel mundial y del Departamento de Defensa de los Estados Unidos.

Especialmente impulsado en estos días por la administración del Presidente Barack Obama a través de DARPA (The Defense Advanced Research Projects Agency) establecida en 1958, también criticado dicho programa por sus polémicos logros en robótica, mapas del cerebro humano, detección selectiva de amenazas internas, externas, en grupo o individuales son hoy por hoy la gestación de lo que podría ser un “Big Brother”.

Adicionalmente se le ha asignado un presupuesto sin precedente histórico para la defensa que, utilizando las palabras de su directora Dr. Arati Prabhakar

“Estamos creando y apoyando a los creadores de la tecnología que se usará por las próximas generaciones y que rompe con muchos paradigmas actuales, para esto hay que pensar fuera de lo convencional por completo “.

Esto a algunos grupos,  científicos, investigadores y tecnólogos a lo largo del mundo les ha hecho “levantar la ceja” más de una vez, lo que nos confirma que no a todos se les puede mantener satisfechos con las decisiones políticas.

Lo importante de esta evolución natural de la tecnología de apoyo a la toma de decisiones empleando grandes cantidades de datos, en múltiples formatos, a gran velocidad y una poderosa profundización de los datos que soportan una decisión es que son un hecho hoy en día, disponible en el mercado y con una larga lista de recomendaciones en su instrumentación que veremos más adelante, pero disponible a costo razonable para la mayoría de las organizaciones.

Actualmente la tecnología ya existe y se encuentra disponible con fines civiles y comerciales a su vez que crece en los siguientes aspectos:

  • Poder de Cómputo en aumento y técnicas de almacenamiento alterna, por ejemplo IMC (In memory computing)

  • Poder de Almacenamiento creciente a un menor costo

  • Capacidad para mantener  almacenados los datos en medios ubicuos

  • Capacidad para manipular datos y darles significado a los datos no estructurados, p.e. desambiguación textual, meaning based computing, map reduce, HADOOP, etc.

  • Incremento constante de la gran cantidad de datos producidos y transmitidos en muy diversos formatos y dispositivos que pueden ir desde el uso y explotación comercial hasta apoyo a tropas en combate usando diversos medios de tecnología y nuevos retos surgen con las guerras virtuales, asistidas por drones, robots y cientos de dispositivos en tiempo real que apoyan la victoria y protegen la vida del soldado en campo.

  • Gran cantidad de dispositivos que producen datos como video, voz, dispositivos militares, climatológicos, redes sociales, satélites de comunicaciones, automóviles, teléfonos inteligentes, sensores de presión, noticieros, radio, TV, reconocimiento biométrico, señales sismológicas, detectores de vida, etc.

  • Gran capacidad de transmisión de datos, estando en fase de desarrollo diversos nuevos tipos de comunicación de una nueva generación de tecnologías para sustituir los viejos satélites de posicionamiento global y comunicaciones, ubicación-transmisión no-satelital-GPS según el DARPA (The Defense Advanced Research Projects Agency) fundado en 1958 con la misión de prevenir cualquier sorpresa estratégica que impacte negativamente a los Estados Unidos, al igual que asegurar el mantener una superioridad militar incuestionable a nivel global.

  • Gran capacidad predictiva y adaptativa del software y la interacción hombre-máquina, métodos intuitivos, algoritmos co-relacionales.

  • Por si estas capacidades fueran pocas, también estamos incrementando nuestra capacidad de protección de datos personales, sensibles, gubernamentales, industriales y militares.

El 29 de Marzo de 2012 Barack Obama anunció el programa DARPA XDATA por parte de la Oficina de Política en Ciencia y Tecnología de la Casa Blanca y otras agencias federales de aquel país como parte de la iniciativa Big Data de DARPA.

Las buenas noticias

Con lo anterior tenemos tres hechos fundamentales sobre Big Data:

1. Es una iniciativa con apoyos muy amplios y de largo plazo que combina múltiples disciplinas y que es fundamental para la seguridad de las naciones.

2. Representa un área de oportunidad y de Inteligencia Estratégica para las empresas que requieran competir en el entorno actual y futuro en el ámbito de los negocios.

Las oportunidades

1. Utilizar Big Data para desarrollar programas de Ventas, CRM, Lealtad, Oferta Dirigida a la Oportunidad, Conocimiento del Cliente, Monitoreo del Desempeño Empresarial en Línea.

2. Desenchufar ese viejo Refrigerador (DW) y potencializar cada componente de recopilación y generación de información y análisis en tiempos mucho más cortos.

3. Crear sistemas de Advertencia Temprana en el ámbito de seguridad pública, política, tendencias de grupos de mercado, etc.

Los Riesgos ya conocidos

Puede que Big Data sea relativamente nuevo, pero para aquellos que llevamos toda una vida inmersos en las tecnologías de Business Intelligence / Data Warehouse / Predictive Analytics sabemos bien que hay ciertas disciplinas, metodologías, técnicas y herramientas que debemos usar para controlar los viejos problemas de manejo y análisis de datos y como menciona nuestro mentor y amigo Bill Inmon considerado el padre del data warehouse a nivel mundial), “nuevos retos surgen al querer dar un significado a los datos no estructurados en un ambiente contextualmente cambiante y donde los datos no estructurados muchas veces requieren de una desambiguación textual para tener un significado concreto”.

La respuesta para atenuar muchos de los riesgos y salvaguardar el retorno de la inversión es “Volver a los orígenes” o bien a consultar con un experto que forme parte del caso de negocios, valide los componentes y proponga las metodologías, herramientas y proporcione acompañamiento para:

  1. Tener clara la Estrategia con la cual se usará Big Data para obtener una ventaja competitiva, inversión, alcance por etapas, disminución de costos y riesgos e incremento de utilidades.
  2. Identificar los potenciales costos ocultos de la iniciativa, por ejemplo: capacitación, limpieza de datos, auditorías de avance, middleware, conectividad, etc.
  3. Establecer un Gobierno de Datos.
  4. Administrar los Catálogos Maestros Globales, Locales y Externos.
  5. Empleo de Técnicas y Herramientas de Calidad de Datos y su monitoreo.
  6. Incrementar la seguridad de acceso a toda la arquitectura.
  7. Dar cumplimiento al ámbito regulatorio nacional e internacional respecto al uso de los datos (omitir este punto puede ser muy costoso).
  8. Conocer e identificar a las fuentes con datos humanos o no humanos considerados “paleros”, información inducida, “Bots” generadores de trends y likes, al igual que todo tipo de bichos que pululan en la web y en las tabletas de muchos adolescentes.
  9. Emplear un cuerpo de conocimientos formal para la Administración y Dirección de proyectos como el PMBok del Project Management Institute y sus áreas de conocimientos.

Los riesgos potenciales

Esta lista se incrementa o disminuye día a día conforme nosotros los entusiastas y nuestros amigos detractores seguimos visualizando las implicaciones para la información personal, de las empresas, de los gobiernos y de seguridad que implica que mucha de nuestra información personal, de patrones de consumo, rutas de ejercicio, listas de supermercado, de nuestro estado de salud, etc. Se encuentren disponibles para su análisis por muchas de estas arquitecturas de este tipo para diferentes propósitos. De hecho estos días existe una gran polémica de cómo esta tendencia puede poner en riesgo la propia seguridad nacional de varios países, entre ellos, los Estados Unidos.

Ante esta realidad yo recomiendo estar preparados y abiertos a una nueva generación de aplicaciones y relacionamientos en los negocios que no tienen precedentes en la historia de la humanidad. Más vale conocer a nuestro Big Brother desde ahora que se está formando y que en muchas ocasiones conocerá más de nosotros, nuestros gustos, fortalezas y debilidades que nosotros mismos.

Referencia:

[1] http://www.gartner.com/it-glossary/big-data/