fbpx

Programa de sesiones

Estas son las sesiones que tenemos confirmadas hasta el momento. 

Day 1
10 Jun 2020

Retos para la implementación de un data lake en CEMEX

Presentaremos el proyecto a través del cual implementamos un data lake en CEMEX. Platicaremos sobre cómo se definió y vendió internamente, los principales retos que enfrentamos, cómo los superamos y qué resultados hemos obtenido.

Una nueva ciencia de datos para México

Abstract pendiente.
Adolfo De Unánue

Active learning o cómo hacer que otros etiqueten datos por ti sin darse cuenta

Caso de estudio sobre aplicación de active learning y procesamiento de lenguaje natural para etiquetar estudios cardiológicos en un hospital.
Victor Vicente Palacios

Taller: Detección de anomalías en series de tiempo

En este taller aprenderemos a detectar outliers en las series de tiempo. Comenzaremos con una explicación matemática de lo que es un outlier y las ideas básicas detrás de un algoritmo con capacidad de generalización. Realizaremos una implementación utilizando Elastic...
Consultar
Alfonso Ruiz Guido

A family-level analysis on dynamics of risk factors and child maltreatment re-reports

Research project where we used population data to estimate family-level child maltreatment and analyze its association with the dynamics of risk factors
Eunhye Ahn

Why data science and UX Research should be best friends

Real-life examples of how Data Science can complement UX research and the kind of applications data scientists and UX researchers can collaboratively work on.
Grishma Jena

Tackling healthcare in low income countries: data science to the rescue?

We will explore and abstract the challenges for data-driven healthcare in low income countries and provide guidelines for success.
Tobias Richter

Curating quality datasets for machine learning

We review the fundamental aspects of dataset curation and will walk through the process of constructing good quality datasets as done in formal settings with a simple hands-on Pythonic example.
Rishabh Misra
Jigyasa Grover

Un viaje a la segmentación del corazón

Segmentación de las cámaras del corazón en imagenes ecocardiográficas utilizando redes neurales convolucionales.
Antonio Sánchez Puente

Ciencia de datos en el conteo rápido para elecciones

Se presentará un modelo utilizado para el conteo rápido en las elecciones federales de México en 2018 el cual se basa en la postestratificación con regresión multinivel.
Teresa Ortíz
Michelle Anzarut

Creación de una calificación crediticia inclusiva

Desarrollo de un score crediticio basado en información no tradicional, como datos psicométricos, y soportado en modelos de machine learning.
Christian Ramírez

Taller: Machine learning y análisis de series de tiempo automatizado con DataRobot

La plataforma DataRobot automatiza el proceso de construir, desplegar y mantener soluciones empresariales de inteligencia artificial. En este taller estudiaremos los principales componentes de la plataforma y aprenderemos como utilizarlos para construir soluciones de IA de clase empresarial a gran...
Consultar

Applied AI Ethics: tools and frameworks in practice

A lot of people are talking about AI ethics, but how is it really being applied in practice? How do we move the focus of the current discourse on AI ethics from killer robots from the future, to practical tools...
Consultar
Nathan Cruz Coulson

Procesamiento de lenguaje natural para reducir el tiempo de respuesta en atención a clientes

Caso de estudio sobre el desarrollo de un sistema inteligente para asistir y acelerar la atención a peticiones en centros de ayuda.
Carlos Caro

Taller: Implementación de pipelines de datos con Apache Beam

Estudiaremos los fundamentos de Apache Beam y aprenderemos a construir un pipeline para procesar datos.

Introducción al machine learning cuántico

An introduction of the main ideas, proposals and results of quantum machine learning, preceded by a concise introduction to quantum computing.
Salvador E. Venegas

Lessons learned in working with real-life data in resource constrained settings with limited domain knowledge

We will share the lessons learned in a project where we collected water samples in the Greater Dakar region and tested them for faecal contamination using different methods. We will walk through some of the challenges of working with real-life data in resource-constrained settings and in with limited prior domain knowledge.
Raphaëlle Roffo

Análisis de patrones de crimen en Ciudad de México

Caso de estudio sobre el desarrollo de un modelo predictivo de actividad criminal en la Ciudad de México.
Carlos Piña García

Machine learning automatizado para acelerar estrategias de IA

Cómo podemos acelerar estrategias empresariales de inteligencia artificial por medio del uso de plataformas de automatización de machine learning como H2O.
Rafael Coss

Compressed sensing with untrained neural networks

How can we leverage neural networks that are untrained? This is an important question in compressed sensing recovery, which traditionally lacks access to large amounts of training data. We will discuss solutions to this problem, various trade-offs, and real-world applications...
Consultar
Dave Van Veen

Taller de ciencia de datos para CEOs: planeación, alcance, reclutamiento y operación

Minicurso para líderes y directivos emprendiendo la jornada para que su organización sea dirigida por datos. Compartiremos historias de errores y oportunidades, y enseñaremos herramientas para descubir, delimitar, contratar y capitalizar proyectos de analítica, ciencia de datos, y machine learning
Jesús Ramos

Análisis de audio para clasificar y predecir el comportamiento de clientes

Analizamos el audio de llamadas de cobranza para clasificar y predecir el comportamiento del cliente.
Omar Peña

Taller: Grafos 101 (los grafos están en todas partes)

En este taller aprenderás a ver el mundo a través de grafos y cómo usar estas estructuras para generar conocimiento de una forma natural. Realizaremos análisis con la herramienta Neo4j.
Roberto Sánchez

Importancia de la selección de métricas de similitud de texto para modelos de Machine Learning

Elegir una métrica de similitud de texto es crucial para el desempeño de nuestro modelo, pero no es una decisión trivial ya que existen numerosas métricas y la elección puede ser confusa. En esta plática revisaremos ejemplos y sugerencias para su adecuada elección.
Blanca Alicia Vargas

Procesamiento de datos acelerado con GPUs usando Bumblebee

Platicaremos sobre cómo acelerar tareas de ETL usando GPUs con la herramienta open source Bumbleebee.
Argenis León

Desarrollo e implementación de un sistema de recomendación

En esta sesión compartiremos el caso de cómo en una empresa en el sector de consumo masivo desarrollamos y pusimos en marcha un algoritmo para sugerir pedidos a cada uno de nuestros cientos de miles de clientes. El sistema utiliza...
Consultar
Betsabé Acuña

Ingeniería de datos: El eslabón perdido en la ciencia de datos

Explicaremos qué hace un ingeniero de datos, las habilidades requeridas para este perfil y compartiré mi experiencia de más de 6 años formando equipos de ciencia de datos que incluyen este rol que es vital.
Guillermo Martinez Becerra

Trucos y recomendaciones para clasificación de textos financieros

Panorama de las principales herramientas y modelos de word embeddings, así como el caso de cómo se utilizan para construir un motor de clasificación de texto en una institución financiera
Pablo Campos