Ya sabemos que al desarrollar un modelo, debemos de seleccionar bien nuestros features para maximizar poder predictivo. También hemos escuchado que "más datos superan a un modelo muy sofisticado". Igual hemos visto que muchos de nosotros tomamos todas nuestras variables y así se las aventamos al modelo, obteniendo relaciones e inferencias espurias.
El concepto del bias-variance tradeoff es lo que nos pone en el justo medio de estas 3 situaciones, y es el concepto más, más, más importante de Machine Learning, y al cual se le dedica poco tiempo en universidades, y nadita en bootcamps.
Vamos a ver como funciona este trade-off con una simulación en R.
Conoce las vacantes de ingeniería y ciencia de datos de Softtek en: https://www2.softtek.com/jobs
- Log in to post comments