fbpx

Programa de sesiones

El programa de Data Day(s) Virtual está diseñada en base a 2 “bloques” diarios de sesiones por día, uno a medio día (diurno) y otro por la tarde (vespertino). Esto con el objetivo de permitir que los participantes puedan balancear su participación en Data Day(s) con sus actividades laborales.

  • En el bloque diurno, habrá dos conferencias (1-1:45pm, 1:45-2:30pm) y un taller (12:00-1:45pm).
  • En el bloque vespertino, habrá tres conferencias (5-5:45pm, 5:45-6:30pm, 6:30-7:15pm) y un taller (5:30-7:15pm).

Los horarios utilizan como referencia el horario de Ciudad de México (GMT-5).

Day 1
03 Ago 2020

Una nueva ciencia de datos para México

Abstract pendiente.
Adolfo De Unánue

Sesión presentada por Cloudera

Detalles por confirmar.

Ciencia de datos en el conteo rápido para elecciones

Se presentará un modelo utilizado para el conteo rápido en las elecciones federales de México en 2018 el cual se basa en la postestratificación con regresión multinivel.
Teresa Ortíz
Michelle Anzarut

Taller de ciencia de datos para CEOs: planeación, presupuesto, reclutamiento y operación

Este taller está principalmente dirigido a líderes y directivos emprendiendo la jornada para que su organización sea dirigida por datos. Exploraremos la construcción de un área analítica en diferentes escenarios y con diferentes insumos. Desde el nacimiento de la necesidad...
Consultar
Jesús Ramos

Importancia de la selección de métricas de similitud de texto para modelos de Machine Learning

Elegir una métrica de similitud de texto es crucial para el desempeño de nuestro modelo, pero no es una decisión trivial ya que existen numerosas métricas y la elección puede ser confusa. En esta plática revisaremos ejemplos y sugerencias para su adecuada elección.
Blanca Alicia Vargas

Creación de una calificación crediticia inclusiva

Desarrollo de un score crediticio basado en información no tradicional, como datos psicométricos, y soportado en modelos de machine learning.
Christian Ramírez
Day 2
04 Ago 2020

Hands-on lab con Snowflake

En este laboratorio práctico mostraremos cómo habilitar un datawarehouse en la nube para datos estructurados y semi-estructurados utilizando la plataforma de Snowflake. Los participantes aprenderán como cargar datos, integrar herramientas y rápidamente obtener analíticas para impactar al negocio. Requisitos: Crear una cuenta de Snowflake (Version: Enterprise, Nube: AWS,...
Consultar

A family-level analysis on dynamics of risk factors and child maltreatment re-reports

Research project where we used population data to estimate family-level child maltreatment and analyze its association with the dynamics of risk factors
Eunhye Ahn

Getting to Know Elastic Data Science

Adding an Elasticsearch cluster to your organization not only offers an opportunity to search, analyze, and view your data in real time, but also provides a strong foundation on which to build robust data science capabilities. In this session we will...
Consultar
Thomas Grabowski

Machine learning automatizado para acelerar estrategias de IA

Cómo podemos acelerar estrategias empresariales de inteligencia artificial por medio del uso de plataformas de automatización de machine learning como H2O.
Rafael Coss

DataStax Developer Workshop: Machine Learning with Apache Spark & Cassandra

In this workshop you will discover the goals and approaches of machine learning, and will write your very own machine learning code using Python, Cassandra, and Spark.
James Colvin

Un modelo efectivo para el seguimiento de COVID19 en México

A raíz de la pandemia de COVID-19 se han utilizado distintos modelos para explicar y predecir su comportamiento, la mayoría de ellos con poca efectividad debido a la baja cobertura de datos y circunstancias cambiantes. En esta charla compartiremos una...
Consultar
Mariana Franklin

Ingeniería de datos: El eslabón perdido en la ciencia de datos

Explicaremos qué hace un ingeniero de datos, las habilidades requeridas para este perfil y compartiré mi experiencia de más de 6 años formando equipos de ciencia de datos que incluyen este rol que es vital.
Guillermo Martinez Becerra
Day 3
05 Ago 2020

Lessons learned in working with real-life data in resource constrained settings with limited domain knowledge

We will share the lessons learned in a project where we collected water samples in the Greater Dakar region and tested them for faecal contamination using different methods. We will walk through some of the challenges of working with real-life data in resource-constrained settings and in with limited prior domain knowledge.
Raphaëlle Roffo

Análisis de audio para clasificar y predecir el comportamiento de clientes

Analizamos el audio de llamadas de cobranza para clasificar y predecir el comportamiento del cliente.
Omar Peña
Day 4
06 Ago 2020

Taller: Definiciones y técnicas para la detección de anomalías

En este taller presentaremos un proyecto de investigación y consultoría sobre la detección de outliers en distintos problemas de predicción. Junto a Karin Alcaraz, Ana Isabel Ascencio y Ernesto Lupercio hemos estudiado la naturaleza y la riqueza de los outliers;...
Consultar
Alfonso Ruiz Guido

Trucos y recomendaciones para clasificación de textos financieros

Panorama de las principales herramientas y modelos de word embeddings, así como el caso de cómo se utilizan para construir un motor de clasificación de texto en una institución financiera
Pablo Campos

Análisis de patrones de crimen en Ciudad de México

Caso de estudio sobre el desarrollo de un modelo predictivo de actividad criminal en la Ciudad de México.
Carlos Piña García

Taller: Procesamiento de datos acelerado con GPUs usando Bumblebee

Platicaremos sobre cómo acelerar tareas de ETL usando GPUs con la herramienta open source Bumbleebee.
Argenis León

La revolución de la ciencia de datos en la manufactura

La manufactura, con todo y su historia de casi 300 años, no está exenta de ser mejorada por técnicas de machine learning. En el siglo XX nació la investigación de operaciones y el modelado matemático pasó a formar parte de...
Consultar
Eduardo Ramírez

Introducción al machine learning cuántico

An introduction of the main ideas, proposals and results of quantum machine learning, preceded by a concise introduction to quantum computing.
Salvador E. Venegas