¿Qué es una Organización Dirigida por Datos?

Publicado en

Este artículo es un extracto del libro “Data Driven” escrito por DJ Patil y Hilary Mason y publicado por O’Reilly Media.

Las organizaciones más conocidas que están dirigidas por datos, son empresas nativas de internet como Google, Amazon, Facebook y LinkedIn.

Sin embargo, estar dirigido por datos no está limitado a internet. Walmart ha sido pionero en el uso de datos desde los 70. Fue una de las primeras organizaciones en construir grandes data warehouses para gestionar el inventario a través de sus negocios. Esto la habilitó para convertirse en la primera empresa en tener más de 1 billón de ventas durante sus primeros 17 años. Y la innovación no terminó ahí. En los 80, Walmart se dio cuenta que la calidad de sus datos no era suficiente, así que para adquirir mejores datos se convirtió en la primera empresa en utilizar lectores de código de barra en las cajas. La empresa quería saber qué productos se vendían y cómo es que el acomodo de productos en la tienda impactaba las ventas. También requería entender tendencias estacionales y diferencias regionales. Conforme aumentó el número de tiendas y volumen de productos, también aumentó la complejidad de manejar el inventario. Gracias a la disponibilidad de datos históricos combinados con un modelo predictivo, la empresa pudo controlar su curva de crecimiento. Para reducir aún más el tiempo para que sus datos se convirtieran en decisiones, Walmart fue la primera empresa en invertir en tecnología RFID. Y recientemente ha puesto sus esfuerzos en tecnologías de procesamiento de datos como Hadoop y Cassandra.

FedEx y UPS también son conocidos por utilizar datos para competir. Por medio de análisis de datos, UPS se dio cuenta que si sus choferes solo daban vueltas hacia la derecha (evitando las vueltas a la izquierda) tendrían menos accidentes, menos tiempo perdido, y ahorrarían en gasolina. Los resultados fueron sorprendentes, en un año ahorraron alrededor de 10 millones de galones de gasolina, contribuyendo también así, a disminuir su impacto al medio ambiente.

De forma similar, General Electric utiliza datos para mejorar la eficiencia de sus motores de avión. Actualmente hay aproximadamente 20 mil aviones operando con 43 mil motores GE. Durante los próximos 15 años se espera que se utilicen 30 mil motores más. Una mejora en eficiencia de 1% resultaría en 30 billones de dólares a través de los próximos 15 años. Parte del esfuerzo para atacar estos problemas es el nuevo motor GEnx. Cada motor cuenta con más de 4 mil partes y pesa cerca de 6 toneladas. Uno de sus principales diferenciadores es la cantidad de datos que registra en tiempo real. De acuerdo con GE, en tan solo un vuelo se genera alrededor de un terabyte de datos. Estos datos son utilizados por los pilotos para tomar decisiones que impacten la eficiencia, y por las aerolíneas para optimizar sus rutas y anticipar problemas de mantenimiento.

¿Qué habilita a estas empresas para utilizar datos para obtener ventaja competitiva?

Una organización dirigida por datos es aquella que adquiere, procesa y aprovecha datos continuamente para crear eficiencias, desarrollar o iterar nuevos productos, y navegar el panorama competitivo.

Desmenucemos esta definición...

El primer paso para trabajar con datos es poder adquirirlos y procesarlos. Pero no es obvio que es lo que tenemos que hacer para lograr esto de forma continua. Las mejores organizaciones dirigidas por datos se enfocan sin cesar en mantener sus datos limpios. Los deben estar organizados, documentados, en un formato consistente, y libres de errores. Limpiarlos típicamente representa 80% de un esfuerzo de ciencia de datos. Establecer procesos para limpiar datos a grandes escalas agrega mayor complejidad. Las organizaciones exitosas hacen inversiones significativas en herramientas, procesos y auditorias para maximizar dicho proceso. Han desarrollado una cultura que comprende la importancia de la calidad de los datos.

Un número sorprendente de organizaciones ha invertido cuantiosamente en sus capacidades de procesamiento de datos, con la esperanza de que eventualmente sus empleados generen valor a partir de ellos. Esta actitud de tipo “si lo construyes, eventualmente vendrán” rara vez es exitosa. El resultado son grandes costos para crear un baúl de datos que rara vez se usa. Las mejores organizaciones utilizan sus datos continuamente para entender a sus clientes y los detalles de su negocio. Hacen experimentos que les permiten demostrar hipótesis que mejoran su empresa y procesos; y utilizan los datos para construir nuevos productos.

Democratizar los datos

La democratización de los datos es una de las ideas más poderosas que ha surgido de la ciencia de datos. Todos los miembros de una organización deberían tener acceso a tantos datos como sea legalmente posible.

El acceso público a datos se ha popularizado en las ciencias (por ejemplo, algunos países dan acceso directo a sus datos del servicio climatológico o de salud). En el caso de las empresas, Facebook es una de las primeras organizaciones que dio acceso general a sus empleados a los datos de la empresa sin necesidad de hacer una petición o esperar autorización. Esta fue una idea radical ya que la noción preexistente era que los empleados no sabrían cómo acceder a los datos y utilizarían datos incorrectos para tomar decisiones de negocio incorrectas. Aunque ciertamente hubo retos que superar, Facebook encontró que los beneficios superaban por mucho a los costos; se convirtió en una empresa más ágil, que rápidamente puede construir nuevos productos y responder a cambios en el mercado. El acceso a datos se ha convertido en una parte crítica del éxito de Facebook, y es algo en lo que continúa invirtiendo agresivamente.

Las principales empresas de internet han seguido el ejemplo de Facebook. Ser capaz de utilizar SQL para acceder datos es una habilidad esencial para todos los analistas y ejecutivos en empresas como Google y LinkedIn. Las organizaciones sin fines de lucro también están viendo grandes beneficios de brindar acceso a sus datos. Se han dado cuenta que expertos fuera de la organización pueden realizar descubrimientos importantes. Por ejemplo, el Banco Mundial abrió sus datos para que grupos de voluntarios puedan limpiarlos e interpretarlos. Esto ha generado tanto valor que creó un sitio web dedicado a datos públicos.

Los gobiernos también han comenzado a reconocer el valor de democratizar el acceso a datos, tanto a nivel local como nacional. Por ejemplo, el gobierno del Reino Unido ha sido líder en esfuerzos de datos abiertos, y el gobierno de Estados Unidos creó la Open Government Initiative para aprovechar este movimiento. Conforme el público y el gobierno comenzó a ver el valor de abrir los datos, los gobiernos empezaron a catalogar sus datos, capacitar al público sobre cómo usarlos, y publicarlos de manera que sean fácilmente consumibles con herramientas. En la ciudad de Nueva York, el acceso a datos llevó a nuevas estrategias basadas en analítica, que obtuvo grandes resultados, incluyendo una mejora de 5x en el tiempo que le toma a los inspectores encontrar departamentos ilegales.

Uno de los retos de la democratización es el de ayudar a las personas a encontrar los conjuntos de datos adecuados y asegurar que dichos datos son de buena calidad. Como ya mencionamos, 80% del esfuerzo del científico de datos es preparar los datos, y es probable que la mayoría de las personas no cuente con la preparación adecuada para realizar la limpieza ellos mismos. Es así que para ayudar a los empleados a utilizar datos de la mejor manera, en algunas organizaciones está surgiendo el rol del delegado de datos (data steward). Su responsabilidad es asegurar la consistencia y calidad de los datos, y gestionar la inversión en herramientas y procesos para lograr esto.