Speaker(s):

Enfrentando los fallos de aplicaciones masivamente distribuidas

Presentado en Data Day 2022

Presentar estrategias para responder al fallo de los sistemas. A través de casos de la vida real se abordará el proceso para resolver incidencias operativas, se mostrarán las cosas que salieron mal y el aprendizaje que dejaron, así como la técnica generalizada para iniciar la exploración de un incidente.

Responder a fallas en cascada

  • Sobrecarga del servidor
  • Agotamiento de recursos -CPU -Memoria -Hilos

Site Reliability Engineering Análisis postmortem