Workshop - Diseñando un Big Pipeline para Big Data

Presentado en Data Day 2017

Los problemas de las infraestructuras de Big Data comienzan al tratar de operar decenas de imágenes de Docker, cientos de componentes, y miles de scripts. Con el tiempo, la falta de escalabilidad en la administración y el alto costo operativo puede tumbar toda el área de Ciencia de Datos de una empresa. En este taller veremos como un equipo pequeño puede crear una infra de millones de registros y operarla automáticamente sin volverse prohibitivamente costosa.