Conversación con Pau Agulló

Pau Agulló es Director Asociado en BCG Gamma, la unidad de Data Science de Boston Consulting Group (BCG). Anteriormente, Pau fue cofundador y managing director de Kernel Analytics, una boutique especializada en algoritmia, y posteriormente integrada en BCG Gamma. Anteriormente trabajó en varias consultoras especializadas en analítica avanzada. Pau es economista por la UPF, MSc en microeconometría y causalidad por la EUI, en Florencia.

Recuerdo cuando te conocí, en Cluster Consulting, hace ya unos cuantos años. Fuiste la primera persona que me habló de modelos de Customer Value Management (CVM). Ya por aquel entonces desprendías pasión por el análisis de datos. ¿Recuerdas cuándo empezó tu idilio con el mundo de Data Analytics? 

Pues empezó en la universidad (la UPF), en las clases de Econometría y Análisis Multivariante donde me cautivó cómo los métodos cuantitativos pueden responder objetiva y sofisticadamente a preguntas muy relevantes. Inicialmente el plan era aplicarlo a investigación académica empírica, pero en Cluster Consulting descubrí que podía aplicarse también al mundo empresarial y se me hizo la luz. ‘Me quiero dedicar a esto’, pensé.

Lo cierto es que desde esa época en Cluster hasta ahora hemos vivido una gran eclosión en el uso de los Datos. ¿A qué crees que obedece esta explosión? ¿Qué factores han sido los que más la han impulsado? 

Ha sido una tormenta perfecta en positivo. El motor principal es la digitalización de la economía y la sociedad, que permite construir gradualmente un ‘gemelo digital’ donde todo lo hecho deja una traza de datos que es analizable posteriormente. Con la llegada de los móviles inteligentes nos hemos convertido en generadores de datos cada uno de nosotros y con el IoT las máquinas también. La telefonía móvil ha permitido emitir y acceder a datos anytime anywhere multiplicando la generación y la demanda también. La capacidad de cómputo de los PC y móviles ha seguido creciendo a ritmo de ley de Moore. Añádele la paralelización de cómputo, que te permite convertir mil PC’s del Media Markt en un superordenador, y las comunicaciones ultraveloces y tienes la nube. Finalmente el desarrollo en comunidad ha dado unos frutos espectaculares (Python). Júntalo con  los softwares liberados por las grandes tecnológicas americanas y tienes que analizar grandes volúmenes de datos nunca había sido tan fácil y tan accesible. Ninguna de estas componentes existía cuando empecé en el 2000.


Y desde un punto de vista puramente de “análisis” ¿qué grandes cambios has observado en estos últimos años? 

Definitivamente, la irrupción de los modelos de machine learning y deep learning, que han permitido analizar texto, imágenes, audios, y videos, que son la mayoría en el mundo, por encima de los datos estructurados. Además, los modelos de ML/DL permiten mayor precisión al detectar patrones menos evidentes y un reentrenamiento sin supervisión humana. Esto ha ampliado el ámbito de aplicación enormemente y generar procesos inteligentes que aprenden continuamente. Esto es más relevante de lo que la gente cree. Hay que tener presente que en muchas ocasiones cuando se desarrolla la primera versión de un algoritmo no hay una muestra gigante de la que aprender. Y muy a menudo la llegada del algoritmo es usada para explorar el resultado de nuevas decisiones (ej: nuevas promociones o precios). Así que cada semana nueva de datos y cada nueva decisión permite explorar o refinar el impacto de las mismas. Que esto sea un proceso automático naturalmente es un catalizador inmenso de resultados. 

Dicho esto, no ha cambiado lo fundamental. La esencia del análisis de datos consiste en ser capaz de transformar una pregunta a una metodología y aplicarla sobre los datos. Ahora tenemos más y mejores herramientas, pero la esencia es la misma. No sirve de nada (es más, es peligroso) saber programar ML/DL sin tener la cabeza bien estructurada. No hay magia en su aplicación ni pueden compensar los errores humanos.

A lo largo de tu trayectoria profesional, has tenido la oportunidad de trabajar para todo tipo de empresas y organizaciones  ¿qué atributos tienen las empresas que le sacan más valor a los datos?

Permíteme una digresión rápida: los economistas tenemos una gran frustración y es que las grandes diferencias entre países ricos y pobres, la gran pregunta a responder, no emerge de cuestiones económicas per se, sino ‘paraeconómicas’, habitualmente la política.


En analytics ocurre una cosa parecida. Las empresas que más valor sacan de los datos no son necesariamente las que más han invertido en data lakes, en herramientas de mercado o usan los últimos modelos de DL, sino aquellas que han sabido integrar mejor los datos y la analítica avanzada en su operativa diaria y en su cultura empresarial. La resistencia al cambio, la incomprensión y la descoordinación pueden destruir el valor de los mejores modelos predictivos.  


Y en todos estos años ¿cuál ha sido tu momento profesional más dulce? ¿Y el aprendizaje más amargo que has tenido? 

He tenido la fortuna de tener una carrera profesional feliz. Así que guardo buenos recuerdos de todas las etapas. Lo digo muy sinceramente. La etapa emprendedora siempre se vive con una intensidad extra. Pero la etapa inicial de descubrimiento del data science fue muy inspiradora. Y la más reciente, en BCG, es una etapa de plenitud con una visión más global. No solo como definir un algoritmo sino como transformar una organización entera. 


Hace muchos años co-fundé una empresa tecnológica donde cometí todos los errores posibles en un periodo de nueve meses. Los aprendizajes son tan básicos, que me da vergüenza compartirlos públicamente. Se resumen fácilmente en un ‘zapatero a tus zapatos’ y que una buena idea no genera valor sin buena ejecución.  

¿Cómo crees que se puede tener y mantener un equipo de Data & Analytics de alto rendimiento? 

Demostrando cada día de la vida que ese es el mejor sitio donde podrían estar para su presente y su futuro. Su presente tiene que ser estimulante, donde puedan contribuir, pero que sea un reto constante. Igualmente importante es el futuro, el desarrollo profesional.

Dos reflexiones rápidas sobre esto: uno, si solo se tiene en cuenta las necesidades de la empresa, sin la visión del data scientist, la inercia natural lleva al monocultivo y especialización, que conduce al aburrimiento, estancamiento y rotación. Sí, es más costosa la itinerancia por casos de uso, tipos de modelo o datos o despliegue, equipos, etc. pero es la clave para la fidelidad y el crecimiento profesional, y en consecuencia la estabilidad del departamento de D&A. Dos, son tan importantes las habilidades hard como las soft. Un data scientist que no puede interlocutar con sus clientes, internos o externos, se convierte en un mero transcriptor de Python al que hay que dar todo masticado. Este recorrido termina muy pronto. Esto no significa necesariamente dejar de programar con el crecimiento profesional, pero sí complementarlo con habilidades de comunicación, diseño global, interlocución, orientación al valor, practicalidad, capacidad de desarrollar en agile, entre muchos otros.

Resumiendo, los DS tienen que crecer horizontalmente (caja de herramientas técnicas más amplia), pero también verticalmente, y esto implica tener un perfil profesional más redondo.

Un tema recurrente en las conversaciones de Managers de equipos de Analytics es “la dificultad de encontrar talento”. ¿Qué perfiles son los más buscados? ¿Cuál dirías que es el rol más difícil de cubrir en la actualidad? 

Creo que ML Op’s es el tema menos maduro actualmente donde es más difícil encontrar perfiles, especialmente senior. Pero es normal. Las empresas llevan varios años desarrollando algoritmos que funcionan bien, pero que todavía funcionan en un modo ‘MVP mejorado’. La acumulación de algoritmos y la industrialización de procesos cuando ya están 100% estables, lleva a la necesidad de la gobernanza y la eficiencia. Estos procesos necesariamente están más ‘verdes’ en muchas organizaciones. Es la consecuencia de ser una disciplina relativamente nueva. 

Termina esta frase. Un buen data scientist es…

Un profesional que sabe (1) transformar una pregunta de negocio en una metodología adecuada al caso de uso, los datos disponibles y el uso futuro del algoritmo, (2) aplicar el mejor modelo y afinarlo, en base a predicción, robustez, interpretabilidad y (3) interlocutar exitosamente con todos los stakeholders del proceso (Negocio y Tecnología), especialmente con el product/process owner. A partir de aquí, y solo a partir de aquí, cuantos más conocimientos analíticos y técnicos tenga, mejor, naturalmente.

¿Cuál es el caso de uso de Data & Analytics que más te ha impresionado? Y no me refiero al típico titular de “esta empresa ha aumentado las ventas un 5% gracias a un modelo predictivo” 

Buf! Esta es complicada. Son muchos. A mí me impresionan los casos de uso por motivos muy distintos: la originalidad del enfoque metodológico, el impacto generado, la sofisticación manteniendo la simplicidad. 

Recientemente me impresionó un proyecto para un país en vías de desarrollo, con serias limitaciones de datos. Se usaron datos satelitales para establecer qué campos había en cada microzona del país viendo cómo cambiaban con las temporadas. Con esto se ubicaron óptimamente instalaciones para el procesado de productos agrícolas y se calculó el volumen de trabajo para dimensionar las inversiones. Me pareció espectacular dados los pocos datos iniciales.

También me ha llamado la atención casos de uso que van orientados a hacer un mundo mejor en los grandes retos de la humanidad: como reducir la emisión de CO2 desde las empresas con IA, como minimizar el despilfarro de comida con mejor previsión de la demanda, incluso en casi tiempo real, y descuentos dinámicos sobre productos perecederos. 

Más en general, los desarrollos de inteligencia artificial aplicada a conducción autónoma, traducción simultánea en tiempo real (incluso con tu voz!) y un largo etcétera de cosas que se hacen en Silicon Valley me tiene permanentemente maravillado. 


Una PYME que quiera iniciar su camino en el ámbito de Data & Analytics ¿por dónde empieza? 

Por integrar datos en su toma de decisiones de una manera sistemática. Empezando por la transformación cultural, que suele ser la más difícil. La mayoría de empresas se beneficiarían de poner los datos a las puntas de los dedos de sus gestores. A partir de ahí, en modo agile, ir añadiendo capas adicionales de inteligencia. Inicialmente indicadores más sofisticados, después modelos predictivos sencillos en modo batch, y así se va haciendo el camino. 

Para priorizar los esfuerzos sí merece la pena hacer un diagnóstico inicial para identificar y priorizar los casos de uso, para enfocar esfuerzos y definir qué datos almacenar y disponibilizar.

¿Qué es para ti la Inteligencia Artificial? 

La capacidad de extraer mucho conocimiento de los cerebros humanos y poder usarlo sin las limitaciones del cerebro humano.


Si miramos hacia el futuro ¿qué grandes cambios crees que viviremos en el mundo de Analytics en los próximos 5-10 años?

Pensando en modo Silicon Valley, estoy convencido que se generarán nuevos métodos que permitirán hacer cosas asombrosas que acercarán aún más la inteligencia artificial a la natural. Pero a mí me interesa (me ocupa) la integración de la IA en la operativa de las organizaciones en base a sus datos, no tanto cuando la IA viene encapsulada en un producto cerrado (que también). Más concretamente, creo que queda mucho recorrido en la agregación armónica de múltiples algoritmos para pasar de la suma de optimizaciones parciales en cada micro-decisión a una optimización global que integre la estrategia de la empresa en ella. Marketing masivo, marketing de clientes, precios y promociones no pueden estar desvinculadas las unas de las otras. Ahora están coordinadas por inteligencia natural, pero no optimizadas conjuntamente por la inteligencia artificial y la aportación podría ser espectacular. Naturalmente no es fácil, pero quién lo consiga tendrá una ventaja competitiva enorme. 


Me gustaría ver también que el Sector Público se pone al día en el uso de la IA para la toma de decisiones. Hay tantos casos de uso como en el sector privado. Naturalmente que la lógica es distinta, pero aún así los algoritmos pueden mejorar los resultados en Sanidad, Educación, Hacienda, Servicios Sociales, y un largo etcétera.


¿Y qué papel han de jugar las Administraciones Públicas en el mundo de Data & Analytics? Aquí me gustaría reflexionar sobre diversos ámbitos: la promoción del talento, el lado ético, el marco legislativo…Seguramente esta pregunta daría para una entrevista.

Pues sí, daría para una entrevista. La revolución de la IA está teniendo lugar delante de nuestros ojos y es un mundo donde se generan círculos virtuosos. Si tienes buenas universidades y másters, un ecosistema de empresas tecnológicas, empresas tradicionales transformándose, inversores, etc. te conviertes en un hub que a su vez sigue atrayendo talento, y este atrae nuevas empresas, etc. Esto es lo que le ha ocurrido a Barcelona. Pero hay que seguir cuidando aspectos clave como mejorar las universidades, facilitar la transformación de espacios para alojar startups (terminar el 22@!), actuar con celeridad cuando hay que definir un marco regulatorio (muy a menudo las startups han emergido donde han tenido un sector público más ágil y no necesariamente más laxo) o facilitar el acceso a datos (anonimizados!) que solo tiene el sector público. Esto sirve para la creación de startups, pero también sirve para la mejora en la toma de decisiones en sector público, que va muchos años por detrás del sector privado en uso de IA en la toma de decisiones.


Cuando tu hija sea un poco más mayor ¿cómo le explicarás en qué consiste tu trabajo?

Complicado. Todavía me queda tiempo para afinar la respuesta. Supongo que usaría ejemplos de cómo el cerebro humano extrae patrones de manera espontánea, sin pensarlo. Y después le mostraría en un papel un ejemplo equivalente, donde el gráfico o el esquema imitaría la misma decisión. El caso más fácil que se me ocurre y uso a menudo con públicos no técnicos es el de la recomendación personalizada (coincidencia de gustos por canciones o películas). Más adelante lo podría sofisticar usando un Excel.


¿Qué producto o servicio basado en Datos te parece más potente? ¿Por qué? 

Mi vida actual en BCG y con una niña de dos años no me deja mucho tiempo para la comparación a fondo de estos productos. El que uso a menudo y me gusta mucho es Spotify porque consigue balancear muy bien la recomendación certera y a la vez permitir la exploración de música que no has escuchado antes. No es trivial encontrar este balance.


Recta final de la entrevista. Abusaré un poco de la confianza y en las dos próximas preguntas te voy “prohibir” que me respondas con el típico “Depende”. Aquí va la primera: en un equipo de Analytics ¿prefieres perfiles junior o perfiles senior?

Estoy entrando en bucle sobre cómo responder… Para tener resultados sólidos en poco tiempo, pocas instrucciones y poca supervisión, perfiles senior, naturalmente. La experiencia es un grado. Son mejores en la ambigüedad, visión global, comunicación, interacción con perfiles distintos, practicalidad y ownership del proceso, y esto viene en buena medida de las ‘horas de vuelo’. Esto es lo que define a un senior en realidad, no los años de experiencia. Hay DS con diez años de experiencia que no tienen estas habilidades que para mí son juniors. Y viceversa con DS que crecen muy rápido. Dicho esto, una de las mayores gratificaciones de mi trabajo es ver crecer a jóvenes DS en todas estas dimensiones. Una auténtica bendición poder contribuir a ello.


Y ahora un clásico: ¿Analytics debe ser un área independiente o debe formar parte de uno o varias áreas de negocio? Recuerda que no puedes responder “Depende” :) 

Grrrr. Soy partidario de una área de Analytics independiente que presta servicios internos a los departamentos. Como si fuera una consultora de analytics interna de la empresa. Los recursos ‘pertenecen’ a Analytics. Esto implica no solo las tareas de RRHH como contratación, formación, etc. sino también definición de los alcances y gestión de los proyectos, y asignación de recursos a proyectos, evaluación y promoción. Así se evita que los DS terminen haciendo trabajo que no les corresponde, que ocurre a menudo cuando son ‘propiedad’ de los departamentos.   


Penúltima pregunta. Recientemente entrevisté a Marco Orellana y le pedí que hiciera una pregunta para la siguiente persona a entrevistar. Su pregunta fue: En Catalunya (y en general en cualquier territorio), ¿qué podemos mejorar para fidelizar y captar más y mejor talento en IA? ¿cómo podemos impulsar aún más el ecosistema catalán para ser pioneros en Europa en estas tecnologías?

Buenas universidades con programas de máximo nivel en IA con becas para captar los mejores estudiantes de todo el mundo (y no solo de la UE!). Una vez están aquí estudiando se trata de que no se vayan. Misma lógica para centros de investigación en IA como el BSC o el ICFO. Son un imán para gente de máximo talento y una fuente de ideas que pueden generar spin-offs. Ya puestos, intentar acercar este mundo a las excelentes escuelas de negocio que tenemos en BCN. Soy un gran partidario de la hibridación. Más facilidades logísticas (espacio) y fiscales para la creación de nuevas empresas. Facilitar todos los elementos que ayuden a generar una comunidad fuerte de DS en la ciudad. Ser ágiles en la regulación para permitir el desarrollo del IA. Que las startups de BCN no tengan que hacer los pilotos en otras ciudades europeas, que lo hace todo más cuesta arriba. Esto no implica laxitud regulatoria. Implica celeridad. Puede ser una ventaja competitiva para la ciudad/país. Acceso a datos (anonimizados!) para el desarrollo de nuevos casos de uso. Aquí vamos muy muy tarde y muy muy mal. La IA para el sector público, la mitad de la economía en Occidente, va muy atrasada y algún día se desarrollará. Y probablemente será en aquél país que haya facilitado un marco para que así sea. No tiene pinta que vaya a ser ni Barcelona ni Cataluña ni España. 

Y tú ¿qué pregunta le harías a la próxima persona entrevistada?

¿Qué podemos hacer para atraer mujeres al data science, ahora claramente infrarrepresentadas?

Anterior
Anterior

Conversación con David Nogué

Siguiente
Siguiente

Conversación con Marco Orellana