Buscando a los desaparecidos de la Guerra Sucia con web semántica y aprendizaje de máquina

Presentado en Data Day 2022

Durante la Guerra Sucia en México, entre 1960-1980, desaparecieron entre 1300 y 3000 personas a manos de la represión gubernamental. La búsqueda de estos desaparecidos implica estructurar la información que se encuentra en toneladas de papeles de los archivos de inteligencia de la contra-insurgencia gubernamental, los colectivos de búsqueda civiles, las acciones de búsqueda posteriores entre otros de tal forma que se pueda acceder eficientemente a ella para informar acciones de búsqueda y acciones judiciales.

Para lograr esto hemos generado un sistema de navegación de documentos basado en tecnologías de web semántica que permite catalogar, anotar manualmente, visualizar y navegar la información de personas, organizaciones, lugares y eventos sucedidos de la Guerra Sucia. Dada la cantidad de documentos es imposible anotar manualmente toda la información, por lo que adicionalmente estamos desarrollando metodologías basadas en técnicas de análisis de texto y de imágenes por computadora. En primer lugar se ha generado una metodología de OCR+NLP para extraer el texto y la clave del expediente de las fotografías de los ficheros de la Dirección Federal de Seguridad (DFS) que se encuentran resguardados públicamente en Archivos de la Represión de Artículo 19.

Este trabajo solo es posible gracias a años de esfuerzo y colaboración de historiadores, familiares de víctimas y activistas por esclarecer la verdad de los desaparecidos de la Guerra Sucia en México.