Finalistas, un año más, del Data Science Hackathon 2019 de I-COM

Después de la victoria obtenida en la edición del 2018, el equipo de DBI Data Business Intelligence volvió a plantarse en la final del Data Science Hackathon, una competición que se enmarca en el I-COM Global Summit. Este congreso internacional, que en esta ocasión se celebró en Málaga, es un evento de referencia para profesionales del Data Marketing de todo el mundo.

¿Y en qué consistió el desafío? Andriy Tkachenko, Jorge González, Leonel Frattesi y Slava Kisilevich aunaron esfuerzos para resolver el reto propuesto por la marca Procter & Gamble (P&G) que quería comprender mejor el comportamiento de su público objetivo. Sólo 24 horas para solucionar un problema real de negocio. ¿Cómo lo hicieron? Aquí te lo explicamos.

I-COM Data Science Hackathon 2019

Desafío P&G: ¿Cómo predecir qué compraran las futuras mamás?

Un elevado volumen de datos, poco tiempo y… ¡mucho ingenio! Estas fueron las herramientas del equipo de DBI Data Business Intelligence que, durante 24 horas, intentó encontrar la mejor respuesta al desafío de P&G. ¿Cómo puede la marca identificar y ofrecer a su target aquellos productos que está buscando cuando sus intereses y necesidades van evolucionando? Y es que, los futuros o recientes mamás y papás experimentan distintos cambios que influyen en sus decisiones de compra.

A partir de aquí, el equipo construyó un modelo de Machine Learning para predecir el comportamiento de 3 tipos de hogares: sin hijos, con hijos de 0 a 3 años y con hijos de 3 a 6 años. ¿Cómo? Entre otros datasets, se basó en un panel de compra de productos de 6.000 familias durante 2017 en el Reino Unido facilitado por los servicios de medición de Kantar. Reunían más de 9 millones de compras de toda la gamma de productos en 828 tiendas, con casi 1.000 promociones diferentes.

El desafío implicaba una primera parte más práctica, es decir, de trabajar con los datos y comprender las diferencias existentes entre estos 3 modelos de hogar pero, también, una segunda parte más reflexiva. ¿Qué motivos hay detrás de esos patrones de comportamiento? Los participantes no únicamente debían elaborar recomendaciones sino también justificar el por qué a partir de los insights obtenidos durante el análisis.

Paso a paso: ¿Cómo se abordó el challenge?

Antes de sumergirse en los datos, los participantes tenían la oportunidad de entrevistar a una madre para comprender mejor su día a día, sus miedos, preocupaciones y obsesiones. De ahí obtuvieron información muy valiosa para poder definir hipótesis sobre los datos. ¿La preocupación por la salud de los hijos afecta al consumo de ciertos productos? ¿Cómo varía su cesta de la compra para mantener el equilibrio en su economía familiar? ¿Cambia su manera de realizar las compras por la falta de tiempo? Una vez terminada la entrevista al equipo le tocaba responder a estas preguntas consultando el dato. Sobre todo, buscaban los cambios más sorprendentes en el patrón de consumo, dejando aparte lo más obvio: compra de pañales, toallitas y potitos, entre otros.

El análisis permitió descubrir que los hogares con niños recién nacidos se gastaban un 14% más de su presupuesto en productos bio que los hogares sin hijos. Un aumento que afectaba claramente, por ejemplo, a algunas de las marcas de productos de limpieza de esta categoría de la compañía. Además, se percibía una drástica caída de la compra de productos que contenían lejía, ambientadores y similares, cuantificando una pérdida del 44% para la marca de P&G.

El reto de balancear la economía doméstica también se reflejaba en los datos. Las nuevas mamás compraban hasta un 28% menos de productos de cuidado personal, dependiendo de la categoría. Algunas de las categorías de productos relacionados con el cuidado de cabello y cuidado dental no experimentaban una caída significativa a nivel general, pero sí a nivel de productos de marca. Las marcas perdían hasta un 23% del presupuesto de los hogares con hijos, mientras que los productos de marca blanca ganaban hasta un 12%. Estamos hablando de segmentos de productos donde esta organización tiene mucha presencia.

La fase de investigación también concluía que la falta de tiempo en el día a día de las familias con hijos significaba que compraban hasta un 50% más en comercios online y, aunque lo hacían con menor frecuencia, las cestas eran un 36% más grandes. Las nuevas familias, además, realizaban hasta un 23% menos de compras durante el fin de semana intentando compensarlo con las compras a lo largo de la semana, probablemente aprovechando los trayectos de trabajo a casa y dejando los fines de semana para disfrutarlos en familia.

Un modelo predictivo con el mejor score

El análisis exploratorio sirvió de gran ayuda para construir un mejor modelo predictivo. Dadas las limitaciones de computación por las reglas del Hackathon, era muy importante entender las variables relevantes en el dataset para conseguir un mayor rendimiento a la hora de entrenar los modelos de ML. Así el equipo de DBI Data Business Intelligence consiguió reducir el número de “features” de 500 a 180 para entrenar el algoritmo con un mayor número de observaciones. De esta manera obtuvieron el mejor F1 Score en el ranking de la competición.

Todas las conclusiones y los insights obtenidos durante el análisis sirvieron para que el equipo argumentara ante los jueces sus recomendaciones de apostar por unos productos determinados. Así también se identificaban los momentos claves para realizar las promociones para los nuevos padres.

I-COM Data Science Hackathon 2019

El Data Science Hackathon de I-COM es una oportunidad única para intercambiar conocimientos y explorar nuevos métodos en un entorno competitivo que motiva a los participantes a ir más allá de los enfoques habituales. En esta ocasión, participaron una treintena de equipos, que se dividieron entre los 3 retos (P&G, Carrefour & Google, Warner Bros) que concluyeron con la presentación de resultados del martes.

Además, si te interesa este tema, te invitamos a descubrir cómo resolvimos el reto del año pasado: Predecir el interés de los usuarios en Inteligencia Artificial.

andriy.tkachenko@havasmedia.com'
Andriy Tkachenko se dedica, desde el inicio de su carrera profesional, al análisis de datos. R Enthusiast y miembro de la Comunidad R Hispano, tiene experiencia en la evaluación y optimización de campañas publicitarias, tanto online como offline.

Enviar comentario

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *