Taller: Diseño de pipelines de datos con GCP DataFlow

Presentado en Data Day 2022

El diseño y ejecución de pipelines de flujos de datos desde sus múltiples fuentes hasta su ingesta y análisis es un requerimiento cada vez más apremiante para los negocios que se encuentran migrando hacia la nube. GCP DataFlow es la solución que permite diseñar y ejecutar flujos de trabajo que aprovechas los diversos servicios de extracción, transferencia, almacenamiento, data warehousing y análisis de datos que ofrece la plataforma GCP.

En este taller se explorarán las soluciones enfocadas a datos der GCP y el modo en el que todas puedes ser orquestadas mediante pipelines de Dataflow escritos en Python.