Kung Fu Analítico: Las tres disciplinas mentales de los líderes de analítica y ciencia de datos

Publicado en

La ciencia de datos y analítica de negocios se cuentan entre las áreas con mayores retos intelectuales de la actualidad. El campo de trabajo es novedoso y apasionante pero también puede imponer un alto nivel de estrés. La actividad cotidiana del científico de datos demanda largas horas de concentración para limpiar y convertir los datos en una representación usable, plantear e iterar hipótesis, consultar referencias teóricas e implementar nuevos métodos, siempre con la sensación de estar a punto de encontrar un “insight” que cambie la historia del negocio … o de tener que comenzar de nuevo con otro enfoque, sólo que esta vez un poco más cerca del “deadline”.

Para los líderes de los equipos de analítica el reto no es menor. Se tiene la responsabilidad de producir iniciativas de alto impacto para el negocio además del desarrollo de propuestas técnicas, presupuestos, negociación con stakeholders, comunicación de resultados y liderear a un equipo de especialistas de alto desempeño. Por si fuera poco, conforme las responsabilidades del científico o líder aumentan, el tiempo disponible para el aprendizaje formal es cada vez más limitado, lo que vuelve más relevante la cuestión de cómo dirigir el esfuerzo intelectual.

A partir de un cierto nivel de competencia técnica, el mayor reto del científico o líder se encuentra en el desarrollo de una mentalidad que facilite navegar la complejidad de la profesión y lograr resultados manteniendo el enfoque y el equilibrio entre la vida personal y profesional. Esta mentalidad se construye mediante la práctica constante de hábitos o disciplinas y por ello la llamamos: el kung-fu analítico.

El significado original del término kung-fu es “habilidad”, que en chino puede referirse a cualquier actividad cuya maestría se adquiere con la práctica. Así, el kung-fu analítico se domina a través del perfeccionamiento de tres disciplinas mentales o tipos de pensamiento:

  1. Crítico-cuantitativo

  2. Estadístico

  3. Científico

Pensamiento crítico cuantitativo

Para muchas personas el término “pensamiento crítico” se relaciona con el escepticismo o la desconfianza,  típicamente en el análisis de las falacias y argumentos en las noticias o discursos políticos, pero el concepto va más allá. De acuerdo a la a Fundación para el Pensamiento Crítico [1], este se define como el arte de analizar y cultivar el pensamiento para mejorarlo continuamente, es decir, la práctica de un pensamiento auto-dirigido y auto-correctivo, sujeto a estándares de excelencia.

La disciplina del pensamiento crítico aspira a lograr un pensamiento con atributos de alta calidad, a los que podemos acercarnos al plantear las preguntas correctas. Estos son: la objetividad (¿Cuáles son los supuestos?), claridad (¿Puedes darme un ejemplo?), exactitud (¿Cómo podemos verificar eso?), precisión (¿Puedes ser más específico?), relevancia (¿Cómo se relaciona con el problema?), profundidad (¿Puedes darme más detalles?) y amplitud (¿De qué otra forma podemos abordar este problema?). Citando a Robert Rubin, podemos juzgar una decisión por su resultado, pero también por el proceso por cómo fue tomada.

Aquí agregamos el enfoque “cuantitativo” para enfatizar que la gran mayoría de la información a la cual se enfrenta un científico o analista de datos es de tipo numérico y para distinguir las formas concretas de aplicar el pensamiento crítico a problemas de datos. También es de interés resaltar una brecha formativa ya que los proponentes del pensamiento crítico usualmente tienen una formación humanística, mientras que los profesionales de los datos usualmente provienen de una formación técnica.

La escritora Laura Miller explica en un artículo [2] la relación que existe entre el pensamiento crítico y la estadística. Indica que tradicionalmente, el pensamiento crítico se ha enfocado a la identificación de falacias en el razonamiento o del uso de lenguaje manipulativo, sin embargo actualmente gran parte de la persuasión y las agendas políticas se presenta en forma de cifras.  El valor de la disciplina del pensamiento crítico en el mundo de los datos nos lleva a cuestionar los supuestos, la calidad o el origen de los mismos y a ser conservadores para establecer conclusiones. Por lo tanto, para mejorar en el kung-fu analítico podemos refinar nuestra batería de preguntas con algunas cuantitativas como: ¿Es confiable la medición? ¿Es consistente el uso de las unidades? ¿Es válido el uso de porcentajes?.  Y así como es necesario cuestionar los datos, también es fundamental cuestionar los propios supuestos cuando los datos apuntan hacia una dirección diferente.

Pensamiento estadístico

Pensar estadísticamente no significa memorizar las fórmulas de la probabilidad y estadística, sino más bien profundizar el uso cotidiano de sus conceptos fundamentales para identificar los sesgos y los errores más comunes. Las ideas estadísticas son abstracciones de la realidad y por lo tanto esconden información.

Una idea aparentemente simple como el promedio es la fuente de muchas conclusiones erróneas al asumir que las condiciones promedio ocurrirán o que un individuo es similar al promedio de su población (se cuenta del estadístico que se ahogó en un lago que tenía una profundidad promedio de 50 centímetros). Un ejemplo de esta falacia: Si el promedio de calificación de un grupo fue de 75, en escala de 0 a 100, y se aprueba con 70: ¿Podemos aseverar que hubo más alumnos aprobados que reprobados? La respuesta es no, porque no conocemos la forma de la distribución y erróneamente asumimos que es “normal”, es decir, que hay aproximadamente la misma cantidad arriba y abajo del promedio. Es posible que unos cuantos alumnos hayan aprobado con muy alta calificación y la mayoría hayan reprobado.

Otro fenómeno estadístico que es fuente común de errores es la llamada “Paradoja de Simpson”. En términos simples es la paradoja que resulta cuando un resultado agrupado apunta a una conclusión, pero al evaluar en subgrupos se percibe un patrón distinto. Recientemente se habló de esta paradoja en relación a un posible caso de discriminación en las admisiones entre hombres y mujeres en la UCSB, ya que la tasa de admisión de los hombres fue de 44% mientras que la de mujeres fue de 35%. ¿Hubo discriminación en la universidad? La respuesta se esclareció al agregar una tercer variable al análisis: el departamento de aplicación. La tasa de aceptación de las mujeres era aparentemente menor porque las mujeres aplicaron en mayor proporción a los departamentos con menores tasas de aceptación. Al analizar las tasas de aceptación por departamento, no se encontró una diferencia atribuible al género.

Consideramos al pensamiento estadístico como una disciplina mental al requerir de una constante alerta para identificar las fuentes de sesgo y error.  También nos requiere practicar la identificación y cuantificación de las fuentes de nuestra incertidumbre. Citando una vez más Robert Rubin: “todas las decisiones que tomamos están sujetas a incertidumbre, pero a pesar de ella hay que decidir y hay que actuar”.

Pensamiento científico

El pensamiento científico es la disciplina mental que nos aporta una metodología para establecer la validez de nuestro conocimiento y avanzar con solidez en el entendimiento de los fenómenos.

Del método científico aprendemos que establecer causalidad no es trivial y que las variables pueden estar relacionadas de formas diversas que nos pueden engañar con facilidad. Una conclusión aceptada actualmente: que el fumar causa cáncer de pulmón fue difícil de establecer en su momento.  Se recuerda a Sir Ronald Fisher, considerado uno de los padres de la estadística, por cuestionar severamente los estudios que apuntaban a esta conclusión: ¿Cómo se podía aseverar que no existía una causa común para la propensión a fumar y a tener cáncer de pulmón? Eventualmente, la forma de probar esta relación causa-efecto fue a través de establecer una relación basada en la dosificación: las personas que fumaban mucho tenían más incidencias de cáncer que las que fumaban poco.

Recientemente Judea Pearl (pionero del enfoque probabilístico a la inteligencia artificial) lanzó una aguda crítica al modus operandi de la ciencia de datos popular, donde se favorece la generación de modelos predictivos como “cajas negras”, sin profundizar en el entendimiento de las relaciones causales entre las variables. ¿Podemos avanzar en el entendimiento de los fenómenos sin entender las relaciones causales entre los inputs y los outputs de un modelo predictivo?

Adicional a los atributos de calidad buscados por la primer disciplina, la tercer disciplina mental agrega los atributos del conocimiento científico: replicabilidad, refutabilidad y la necesidad de evidencia empírica.

Conclusión: El rol del líder analítico

La aportación clave de un líder que conoce el kung-fu analitico es generar la discusión necesaria con apego a los principios del pensamiento crítico, estadístico y científico para evitar invertir en iniciativas analíticas que no entregaran resultados al negocio y encontrar las que sí lo harán, anticipándose a las objeciones y necesidades de los usuarios que se verán impactados por la nueva tecnología. En el gran esquema de las cosas es más fácil crear modelos predictivos que transformar el funcionamiento de las organizaciones.

Sun-Tzu asevera que los mejores guerreros son los que primero ganan y luego van a la guerra. Así, con las tres disciplinas del kung-fu analítico, los líderes pueden avanzar sistemáticamente en su entendimiento de las distintas decisiones y procesos que se pueden impactar, para posteriormente definir los modelos y sistemas que se deben de construir para mejorarlos confiando que el proceso de análisis tuvo la claridad, amplitud y profundidad necesaria. Así los líderes pueden escoger sus batallas y ganarlas antes de empezar.

 

Referencias

  1. “The Foundation for Critical Thinking”. https://criticalthinking.org   

  2. L. Miller. “What are the odds?” Slate, agosto 2015. http://swgu.ru/v0

 

Bio

Eduardo H. Ramirez, Ph.D. Doctorado en Sistemas Inteligentes con tesis en aprendizaje no-supervisado. Ex-colaborador en Microsoft y Yahoo!  Fundador y organizador de la comunidad de Data Science en Monterrey desde 2015. Actualmente es Director de Analytics y Cloud Operations en Ensitech.