Se presenta un modelo de predicción de la contaminación atmosférica por partículas PM2.5 en la Zona Metropolitana de Toluca. El modelo predictivo se realizó considerando un conjunto de datos obtenido de la RAMA. El proceso metodológico se centró en preparación del conjunto de datos y su análisis descriptivo, la elección de las mejores variables, la generalización del algoritmo, la elección de los mejores hiper parámetros que ayudaron a ajustar el modelo, una predicción de la contaminación por medio de técnicas clasificación y regresión y la interpretación y explicación de los resultados. En todos los procesos se aplicaron técnicas de Machine Learning haciendo uso de las librerías de Sckit Learn con algoritmos en Python. Los modelos se evaluaron con métricas de regresión y métricas de clasificación. Los resultados de la predicción generaron valores de contaminación por PM2.5 muy similares a la media actual, teniendo un error de variación de aproximadamente 5.5% equivalente a 5.35 unidades IMECA de partículas PM2.5. El modelo de clasificación encontró una probabilidad del 81% de que en 51 días la calidad del aire predicha como mala en realidad sea regular.