Data Day 2018

Data Day México 2018 se llevó a cabo el 15 de marzo de 2018 en Ciudad de México. Para información sobre futuras ediciones de Data Day, visita https://sg.com.mx/dataday

Aquí puedes ver las grabaciones de algunas de las sesiones.

Strategies to edit production data

Evento

Data Day 2018

Conferencista(s)

Julie Qiu

At some point, we all find ourselves at a SQL prompt making edits to the production database. We know it’s a bad practice, and we always intend to put in place safer infrastructure before we need to do it again, but what does a better system actually look like?

This talk progresses through 5 strategies for teams using a Python stack to do SQL writes against a database, to achieve increasing safety and auditability:

Lectura de comprensión automatizada con Deep Learning

Evento

Data Day 2018

Conferencista(s)

Fernanda Mora Alba

Stanford tiene un dataset de entrenamiento llamado SQuAD para probar modelos de análisis de texto y de comprensión de textos mediante duplas de pregunta-respuesta. Presentaremos modelos de deep learning desarrollados durante un verano de investigación en Carnegie Mellon para lograr responder las preguntas incluídas en el dataset.

You might not need Pandas

Evento

Data Day 2018

Conferencista(s)

Reuben Cummings

Pandas is a great numerical libraries for data analysis. However, this convenience comes at the cost of a complex installation process (usually suggesting that you install anaconda to sidestep the issue), and several megabytes of extra dependencies. In many cases, the extra efficiency provided by pandas isn’t required, and a few lines of utility code can allow you to forgo pandas all together.

Optimización del sistema de transporte por medio de aprendizaje por refuerzo

Evento

Data Day 2018

Conferencista(s)

Adolfo Martínez

El Sistema de Movilidad (SM1) de la Ciudad de México tiene rutas y paradas predefinidas, pero los horarios son controlados por operadores humanos. Los operadores controlan los horarios de salida en base a las condiciones tales como tráfico y condiciones climáticas.

De Género a Género: El uso del lenguaje a través de vectores de palabras

Evento

Data Day 2018

Conferencista(s)

Irving Simonin Wilmer

A través del contexto bajo el cual se usan las palabras podemos definir un espacio vectorial con propiedades interesantes. ¿Serán suficientes para catalogar el uso del lenguaje a través de géneros literarios?

Cuando la tierra se sacude

Evento

Data Day 2018

Conferencista(s)

Amaury Gutiérrez

La colaboración masiva demostró ser un recurso fundamental para afrontar las secuelas que provocó el sismo del 19 de septiembre de 2017 en la Ciudad de México. El uso de las redes sociales permitió la comunicación entre las labores de rescate, logística y la sociedad civil. Se aprendieron lecciones sobre los alcances y las limitaciones de esta asociación. Sin embargo, ¿qué pasa cuando no existen las condiciones ni la infraestructura tecnológica propias de las grandes urbes?

Sanitización de datos y privacidad

Evento

Data Day 2018

Conferencista(s)

Juan Zinser

Un obstáculo típico para la labor de analítica son las políticas de privacidad que tienen que ser resguardadas por las áreas de IT o compliance, por lo tanto compartir datos al equipo de análisis se vuelve difícil, y cuando sucede, frecuentemente se omiten datos que poseen información relevante. Efectivamente, el proceso típico de sanitización previo a la compartición de datos destruye información.

La importancia estratégica de considerar mezclas de distribuciones

Evento

Data Day 2018

Conferencista(s)

Moyocoyani Molina Espíritu

El mixture model (o modelo de mezcla de distribuciones) es un modelo probabilístico que considera la existencia de subpoblaciones dentro de una población general. En varias ocasiones se tiene un sistema complejo que se caracteriza por irregularidades en su distribución, o su comportamiento es atípico y se requiere conjeturar la existencia de más de un conjunto de individuos o poblaciones.

RKHS, teoría y aplicaciones con machine learning

Evento

Data Day 2018

Conferencista(s)

Alonso Baranda

La idea de la plática es hacer un recorrido sobre los RKHS, (Reproducing Kernel Hilbert Spaces) que son el corazón de las máquinas de soporte vectorial, los cuales están unidas por el “Kernel Trick”, el truco favorito de los Científicos de Datos.

IoT + BI: Cómo resolver la disparidad de velocidad

Evento

Data Day 2018

Conferencista(s)

El Internet de las cosas (IoT) se está convirtiendo en la “navaja suiza de la industria minorista”, con cientos de posibles casos de uso diferentes. De acuerdo con Gene Wojciechowskiantiguo CIO de Walmart.com, “La tecnología IoT no solo permitirá una mejor visibilidad, sino que también puede ayudar en la prevención de pérdidas y medir el impacto de los factores ambientales, como el calor, en los bienes en movimiento. a través de la cadena de suministro”.

Behind the AI Curtain: Designing for trust in machine learning products

Evento

Data Day 2018

Conferencista(s)

Crystal Yan

When startups first launch, they can make the news with application of cutting edge AI – but convincing users to trust the AI is often another story. There’s often also no process for integrating future AI development into product roadmaps.

Preparando nuestras ciudades para la transformación digital

Evento

Data Day 2018

Conferencista(s)

Zinnya del Villar

La forma en que operan las ciudades debe mejorar creando una conexión cívica más sólida con los ciudadanos. Por lo tanto, las ciudades deben estar preparadas para responder con eficacia y garantizar dicha conexión de manera integral en sus diferentes sectores gracias a la transición digital. Sin embargo, esta transición digital requiere una definición clara de roles y responsabilidades.

Taller: Limpieza y preparación de datos con Optimus y Spark

Evento

Data Day 2018

Conferencista(s)

Favio André Vázquez

En cualquier iniciativa con datos, una de las actividades que más tiempo consume (y que es más tediosa) es la limpieza, preparación y transformación de datos. Existen distintos frameworks y herramientas que nos pueden ayudar a acelerar y coordinar dicha tarea, una de ellas es Optimus. Optimus es una biblioteca open source, construida por desarrolladores mexicanos, que es actualmente utilizada en BBVA.

Taller: Datos en tiempo real con GraphQL

Evento

Data Day 2018

Conferencista(s)

Rodrigo Quezada

GraphQL se está posicionando como una alternativa sólida para ofrecer datos para aplicaciones de tiempo real.

En este taller práctico construiremos un backend sencillo de GraphQL utilizando GraphQL Yoga, un servidor open source para GraphQL.

Cómo construir pipelines para streaming de datos en visualizaciones: Un ejemplo divertido usando Minecraft

Evento

Data Day 2018

Conferencista(s)

Ángel Alvarado

La visualización de flujos continuos (streams) de datos brindan un mecanismo poderoso de monitoreo. En esta plática mostraremos cómo utilizar distintas herramientas para construir un pipeline de streaming de datos utilizando un ejemplo divertido del videojuego Minecraft.

Taller: Análisis de datos con MongoDB

Evento

Data Day 2018

Conferencista(s)

En este taller aprenderás cómo insertar, enriquecer y analizar datos con MongoDB. También veremos cómo usar los datos existentes en MongoDB desde Python y desde una herramienta de BI.

Taller: Dplyr + R + Spark = Sparklyr

Evento

Data Day 2018

Conferencista(s)

El paquete de R llamado sparklyr facilita el aprendizaje mediante un instalador de Spark que se puede usar dentro de una computadora personal, incluyendo Windows. En este taller los participantes aprenderán a utilizar Spark por medio de R mediante el uso de diferentes técnicas y funciones para transformar datos, crear modelos estadísticos, y programar canales de datos.

Lo que las Telcos saben de nosotros y a quíen se lo dan

Evento

Data Day 2018

Conferencista(s)

Las empresas telefónicas guardan toneladas de información de nosotros para ajustar campañas y, a veces, dar mejor servicio, pero también están obligadas por el IFT a entregar dicha información a entidades gubernamentales y cooperar con ellas en investigaciones, sobre todo de seguridad nacional. Lamentablemente, esta regulación está llena de ambigüedades e interpretaciones que se vuelven relevantes a la luz del entramado político de cara a Julio 2018.

Cromatocracia: El Pantone de la movilidad social en México

Evento

Data Day 2018

Conferencista(s)

Adrián Santuario

¿Existe una formula matemática para lograr la movilidad social en México? La respuesta es afirmativa: Debes tener tez clara, tener estudios de posgrado (de preferencia por el ITESM o IPADE) y hablar inglés.

Usos correctos (e incorrectos) de los datos de INEGI

Evento

Data Day 2018

Conferencista(s)

Andrea Fernández Conde

Recientemente, las oficinas de estadística han realizado múltiples esfuerzos para que sus datos sean más accesibles y fáciles de utilizar: están en datos abiertos, con microdatos disponibles en internet, se acompañan de metadatos estandarizados y documentos metodológicos. A pesar de esto, hay algunos detalles metodológicos que es muy importante considerar cuando se utilizan datos oficiales que escapan a estos estándares.

El proyecto fue un éxito, ¿y ahora?

Evento

Data Day 2018

Conferencista(s)

Ángel Monjarás

Has construido una solución de analítica de datos para tu empresa y ha sido un éxito, los ejecutivos ahora no pueden vivir sin ella. El siguiente paso es transicionar la solución de ser un “extra” a convertirse en una parte integral de la operación del negocio. Esta plática se enfoca en cómo hacer esta transición.

Grandes poderes, grandes responsabilidades

Evento

Data Day 2018

Conferencista(s)

José Antonio Padrós

La analítica de datos se ha convertido en la nueva forma de convencer a las personas y empresas, y por lo tanto la nueva forma en que discutimos. Esto lleva a personas con formación técnica a desempeñarse en ámbitos que no le son familiares, ya que tradicionalmente pertenecen a los abogados, reporteros e investigadores.

En esta plática veremos cómo podemos aprender de sus métodos para complementar los nuestros y poder llegar más lejos en nuestras iniciativas de analítica.

El camino hacia la empresa inteligente

Evento

Data Day 2018

Conferencista(s)

Arturo Cárdenas

En esta charla conversaremos sobre cómo los grandes volúmenes de datos ayudan a dirigir las estrategias de las empresas, y cómo desde la alta dirección se deben arropar estas iniciativas para que resulten en cambios culturales duraderos y no solo en proyectos tecnológicos a medio cocinar.

Machine learning usando Weka, en un entorno de cómputo distribuido

Evento

Data Day 2018

Conferencista(s)

En esta sesión mostraremos lo sencillo que es implementar algoritmos de machine learning en un entorno de cómputo distribuido por medio de Weka. Weka es una herramienta de software libre para data mining y machine learning, la cual fue desarrollada por la Universidad de Waikato en Nueva Zelanda. Durante la sesión demostraremos casos de uso reales y cómo se implementan con Weka.

MongoDB en la transformación digital

Evento

Data Day 2018

Conferencista(s)

En esta plática abordaremos algunos retos existentes en la ejecución de iniciativas de transformación digital y de qué manera MongoDB ha apoyado a sus clientes a remediarlos y a innovar de formas que antes no eran posibles.

Innovación @Amazon

Evento

Data Day 2018

Conferencista(s)

En esta plática exploraremos el modelo que Amazon utiliza para innovar. Compartiremos como lo ha aplicado en distintos negocios enfocados en diferentes mercados, cuáles son los pilares de su modelo de innovación, y como este modelo está íntimamente ligado a su cultura y procesos de negocio.

Subscribe to Data Day 2018