Desarrollo y despliegue de modelo predictivo basado en combinación de técnicas optimizadas de machine learning, con el cual es posible determinar la dosis óptima de productos químicos a aplicar al agua cruda en el proceso de potabilización en una planta potabilizadora de agua en de la ciudad de Medellín-Colombia, con lo que es posible reemplazar una técnica tradicional y manual como lo es el ensayo de jarras para determinar las dosis de químicos que se debe ingresar el proceso de potabilización a partir de las características del agua cruda que está ingresando en cada momento a la planta.
El análisis comienza con un análisis descriptivo y diagnóstico de los datos capturados de los distintos sensores instalados en las cuencas aguas arriba de la captación del agua, los cuales permiten tener una caracterización en tiempo real del agua del río que se está captando en el momento, además mediante técnicas de análisis mutivariado se analiza la relación de las condiciones del agua con datos meteorológicos como el clima y la precipitación. Finalmente, se entrenan diversos tipos de modelos de machine learning, pasando por los más generales a los más complejos, con sus respectivos métodos de optimización para mejorar sus métricas, y por último se ensamblan algunos de los mejores modelos en uno solo con lo cual los resultados obtenidos mejoran considerablemente. El modelo se despliega en una aplicación web para usuario final, siguiendo las mejores prácticas de entornos virtuales y encapsulamiento de código, utilizando 100% Python modelado y despliegue, usando Heroku como plataforma de despliegue, y tecnología Git y Github para gestión de versionamiento.