Optimización del sistema de transporte por medio de aprendizaje por refuerzo

El Sistema de Movilidad (SM1) de la Ciudad de México tiene rutas y paradas predefinidas, pero los horarios son controlados por operadores humanos. Los operadores controlan los horarios de salida en base a las condiciones tales como tráfico y condiciones climáticas.

En esta plática mostraremos un sistema construido para recomendar tiempos de salida de manera automática por medio de un modelo de machine learning y un agente de aprendizaje reforzado (reinforcement learning). El modelo provee un mecanismo para simular recorridos, mientras el agente aprende de dichas simulaciones para determinar el mejor momento para enviar a cada camión.

Optimización del sistema de transporte por medio de aprendizaje por refuerzo

Adolfo Martínez

Optimización del sistema de transporte por medio de aprendizaje por refuerzo