El Sistema de Movilidad (SM1) de la Ciudad de México tiene rutas y paradas predefinidas, pero los horarios son controlados por operadores humanos. Los operadores controlan los horarios de salida en base a las condiciones tales como tráfico y condiciones climáticas.
En esta plática mostraremos un sistema construido para recomendar tiempos de salida de manera automática por medio de un modelo de machine learning y un agente de aprendizaje reforzado (reinforcement learning). El modelo provee un mecanismo para simular recorridos, mientras el agente aprende de dichas simulaciones para determinar el mejor momento para enviar a cada camión.