Taller: Limpieza y preparación de datos con Optimus y Spark


En cualquier iniciativa con datos, una de las actividades que más tiempo consume (y que es más tediosa) es la limpieza, preparación y transformación de datos. Existen distintos frameworks y herramientas que nos pueden ayudar a acelerar y coordinar dicha tarea, una de ellas es Optimus. Optimus es una biblioteca open source, construida por desarrolladores mexicanos, que es actualmente utilizada en BBVA.

En este taller, impartido por uno de los desarrolladores de Optimus, aprenderás a realizar limpieza y preparación de datos utilizando Optimus en conjunto con Apache Spark y Python (PySpark).