fbpx

Programa de sesiones

El programa de Data Day(s) Virtual está diseñada en base a 2 “bloques” diarios de sesiones por día, uno a medio día (diurno) y otro por la tarde (vespertino). Esto con el objetivo de permitir que los participantes puedan balancear su participación en Data Day(s) con sus actividades laborales.

  • En el bloque diurno, habrá dos conferencias (1-1:45pm, 1:45-2:30pm) y un taller (12:00-1:45pm).
  • En el bloque vespertino, habrá tres conferencias (5-5:45pm, 5:45-6:30pm, 6:30-7:15pm) y un taller (5:30-7:15pm).

Los horarios utilizan como referencia el horario de Ciudad de México (GMT-5).

Day 1
03 Ago 2020

Una nueva ciencia de datos para México

México se encuentra en una posición privilegiada para evolucionar su práctica de ciencia de datos. Gracias a nuestro enfoque en automatización, existen las bases para pasar del paradigma ETL-> Limpieza -> Modelado -> Predicción, a uno de dinámica de sistemas...
Consultar
Adolfo De Unánue

La nube es buena pero el multicloud es mejor, por Cloudera

En la era en que las nubes son el nuevo hardware, su utilización debe ser: abierta, multi-nube, gobernada, segura y con la posibilidad de cambiar de proveedor, con tan solo un click. En esta charla patrocinada por Cloudera revisaremos las...
Consultar
Hernan Galante
Julio Cesar Perez

Storytelling en Ciencia de Datos: desde la hipótesis del problema, estructura, visualización y validación

En un presente en que todo implica datos, algunos almacenados, pocos analizados y menos todavía interpretados, es de especial relevancia hacernos las preguntas correctas. La estructura de storytelling no es más que un procedimiento lógico, comprensible para todas las áreas...
Consultar
Silvia Ariza

Taller de ciencia de datos para CEOs: planeación, presupuesto, reclutamiento y operación

Este taller está principalmente dirigido a líderes y directivos emprendiendo la jornada para que su organización sea dirigida por datos. Exploraremos la construcción de un área analítica en diferentes escenarios y con diferentes insumos. Desde el nacimiento de la necesidad...
Consultar
Jesús Ramos

Importancia de la selección de métricas de similitud de texto para modelos de Machine Learning

Elegir una métrica de similitud de texto es crucial para el desempeño de nuestro modelo, pero no es una decisión trivial ya que existen numerosas métricas y la elección puede ser confusa. En esta plática revisaremos ejemplos y sugerencias para su adecuada elección.
Blanca Alicia Vargas

Creación de una calificación crediticia inclusiva

Desarrollo de un score crediticio basado en información no tradicional, como datos psicométricos, y soportado en modelos de machine learning.
Christian Ramírez
Day 2
04 Ago 2020

Taller: Hands-on lab con Snowflake

En este laboratorio práctico mostraremos cómo habilitar un datawarehouse en la nube para datos estructurados y semi-estructurados utilizando la plataforma de Snowflake. Los participantes aprenderán los conceptos básicos de una plataforma de datos para la nube y de la arquitectura de Snowflake. Aprenderán de manera...
Consultar
Javier Ruiz

A family-level analysis on dynamics of risk factors and child maltreatment re-reports

Research project where we used population data to estimate family-level child maltreatment and analyze its association with the dynamics of risk factors
Eunhye Ahn

Getting to Know Elastic Data Science

Adding an Elasticsearch cluster to your organization not only offers an opportunity to search, analyze, and view your data in real time, but also provides a strong foundation on which to build robust data science capabilities. In this session we will...
Consultar
Melissa Alvarez
Thomas Grabowski

El futuro de la inteligencia artificial y la próxima frontera de apps de IA presentado por H2O.Ai

Cómo podemos acelerar estrategias empresariales de inteligencia artificial por medio del uso de plataformas de automatización de machine learning como H2O.
Rafael Coss

Taller: DataStax Developer Workshop: Machine Learning with Apache Spark & Cassandra

In this workshop you will discover the goals and approaches of machine learning, and will write your very own machine learning code using Python, Cassandra, and Spark.
James Colvin

Ciencia de datos en el conteo rápido para elecciones

Se presentará un modelo utilizado para el conteo rápido en las elecciones federales de México en 2018 el cual se basa en la postestratificación con regresión multinivel.
Teresa Ortíz
Michelle Anzarut

Ingeniería de datos: El eslabón perdido en la ciencia de datos

Explicaremos qué hace un ingeniero de datos, las habilidades requeridas para este perfil y compartiré mi experiencia de más de 6 años formando equipos de ciencia de datos que incluyen este rol que es vital.
Guillermo Martinez Becerra
Day 3
05 Ago 2020

Taller Grafos 101: Los grafos están en todas partes

El mundo está compuesto por infinidad de redes interconectadas, piensa un momento la red que forman tus amigos y los amigos de tus amigos, cómo funciona una red celular, la forma en la que operan las tiendas e-commerce, etc. En...
Consultar
Luis Eduardo Almazán Sifuentes

Lessons learned in working with real-life data in resource constrained settings with limited domain knowledge

We will share the lessons learned in a project where we collected water samples in the Greater Dakar region and tested them for faecal contamination using different methods. We will walk through some of the challenges of working with real-life data in resource-constrained settings and in with limited prior domain knowledge.
Raphaëlle Roffo

Event Streaming for Real Time enterprises, por Confluent

La capacidad de procesar y consumir datos en tiempo real ya no solo es una posibilidad, sino una ventaja competitiva que están tomando las empresas líderes. En esta sesión platicaremos sobre por qué y cómo establecer arquitecturas de datos modernas...
Consultar
Joao Salcedo

Un modelo efectivo para el seguimiento de COVID19 en México

A raíz de la pandemia de COVID-19 se han utilizado distintos modelos para explicar y predecir su comportamiento, la mayoría de ellos con poca efectividad debido a la baja cobertura de datos y circunstancias cambiantes. En esta charla compartiremos una...
Consultar
Teresa Ortíz
Michelle Anzarut

Taller: H2O Driverless Ai workshop: Aprenda machine learning automático a gran escala

¿Cómo puede llevar el aprendizaje automático a las masas? ¿Cómo puede tener varios equipos en su organización para crear modelos de ML precisos sin ser expertos en ciencia de datos o aprendizaje automático? Venga a esta sesión y descubra cómo...
Consultar
Luis Martínez
Rafael Coss

Análisis de audio para clasificar y predecir el comportamiento de clientes

Analizamos el audio de llamadas de cobranza para clasificar y predecir el comportamiento del cliente.
Omar Peña

Análisis de patrones de crimen en Ciudad de México

Caso de estudio sobre el desarrollo de un modelo predictivo de actividad criminal en la Ciudad de México.
Carlos Piña García
Day 4
06 Ago 2020

Taller: Definiciones y técnicas para la detección de anomalías

En este taller presentaremos un proyecto de investigación y consultoría sobre la detección de outliers en distintos problemas de predicción. Junto a Karin Alcaraz, Ana Isabel Ascencio y Ernesto Lupercio hemos estudiado la naturaleza y la riqueza de los outliers;...
Consultar
Alfonso Ruiz Guido

Trucos y recomendaciones para clasificación de textos financieros

Panorama de las principales herramientas y modelos de word embeddings, así como el caso de cómo se utilizan para construir un motor de clasificación de texto en una institución financiera
Pablo Campos

DATA OPS: LA EVOLUCIÓN EN LA GESTIÓN DE DATOS

Para que los datos generen valor al negocio, no basta con capturarlos y crear modelos. Es necesario gestionarlos de forma coordinada, de principio a fin. En esta sesión abordaremos temas de DATAOPS y discutiremos sobre la importancia de reducir el...
Consultar
Santiago Díaz

Aequitas: el framework para detectar prejuicios en modelos de Machine Learning

Las herramientas basadas en machine learning e inteligencia artificial cada vez se aplican más en contextos donde pueden tener un impacto drástico en la vida de las personas en aspectos como justicia criminal, educación salud, oportunidades profesionales y servicios sociales....
Consultar
Liliana Millán

Taller: Procesamiento de datos acelerado con GPUs usando Bumblebee

Platicaremos sobre cómo acelerar tareas de ETL usando GPUs con la herramienta open source Bumbleebee.
Argenis León

La revolución de la ciencia de datos en la manufactura

La manufactura, con todo y su historia de casi 300 años, no está exenta de ser mejorada por técnicas de machine learning. En el siglo XX nació la investigación de operaciones y el modelado matemático pasó a formar parte de...
Consultar
Eduardo Ramírez

Introducción al machine learning cuántico

An introduction of the main ideas, proposals and results of quantum machine learning, preceded by a concise introduction to quantum computing.
Salvador E. Venegas-Andraca
Day 5
07 Ago 2020

Examinando y prediciendo las respuestas del INAI: Un safari por la transparencia

Como parte del fellowship Summer of Data de SocialTIC y la Sociedad Mexicana de Ciencia de Datos, se está desarrollando un análisis exhaustivo de las solicitudes de información que llegan al INAI de 2012 a 2019. Veremos lo que la...
Consultar
Angel Rafael Ortega Ramírez
Diego Villa