Conversación con Eduard Gil

Eduard Gil es Licenciado en Historia (UAB), Master in Business Administration ESADE y Master en Big Data (EOI). Profesor de EADA, UOC, IL3, Eurecat y UPF en temas de gestión del dato. Es desde el 2018 Chief Data Officer del Hospital de la Santa Creu i Sant Pau. Ha sido Director de Servicios Centrales del Ayuntamiento de Rubí, Gerente Municipal del Ayuntamiento de Gavà y Director de Sistemas de Información del proveedor público de servicios de salud Sagesa.

Me ha llamado mucho la atención que después de haber estudiado Historia y Ciencias Políticas hayas acabado dedicando tu carrera profesional en el mundo de los Datos. ¿En qué momento descubriste tu pasión por este campo?

Yo llegué al dato desde la gestión. Hace muchos años decidí que mi pasión era la gestión y por eso estudié un MBA en ESADE.  A principios de este siglo -¿suena fuerte no?- estudiando en ESADE en pleno primer boom del e-commerce entre en contacto con el mundo de los Sistemas de Información (S.I) y siempre he tenido claro que para gestionar bien hacen falta buenos S.I y buenos datos. De mis repetidas frustraciones gerenciales con los datos, su calidad y uso llegó la decisión personal hace ya casi diez años de que hacía falta ponerse a trabajar en este campo como especialista y ya no solo como consumidor.

Has dedicado buena parte de tu trayectoria profesional al sector público con cargos en el Ayuntamiento de Gavá o la Generalitat de Catalunya. Me gustaría saber, qué grandes iniciativas de datos pudiste impulsar y entender los grandes logros de los que te sientes más orgulloso y también las grandes dificultades que te encontraste

El mayor reto de proyectos de datos bajo mi punto de vista casi nunca es tecnológico. Los proyectos de datos son proyectos que están destinados a fracasar si no se logra impactar en la cultura de la organización. De muy poco sirve tener montada una gran infraestructura de datos si la organización no consume los productos por no ponerse de acuerdo sobre el significado de los principales KPI, si el dato que ingesta esa infraestructura es de dudosa calidad porque no se cuidó su ciclo de vida o si los algoritmos no terminan en producción porque se desconfía de sus resultados. En mi opinión, el principal reto siempre está en las personas. Superar la cultura de toma de decisiones basada únicamente en la experiencia y apalancarse también en la evidencia gestionando el dato como un verdadero activo de la organización es siempre el gran reto organizativo y cultural.

En cuanto a las iniciativas de las que me siento más orgulloso destacaría lanzar uno de los primeros portales de datos abiertos con estándares anglosajones, en cuanto a automatización, reutilización e importancia de los datasets publicados. Introducir procesos vinculados con el gobierno del dato. Impulsar la democratización del dato a través de iniciativas para conceder autonomía al negocio en la explotación y análisis de los datos más importantes ayudándoles a entender sus procesos clave.  Esponsorizar iniciativas de predicción mejorando las herramientas utilizadas con nuevos algoritmos de mayor potencia predictiva. 

Y en este sentido. ¿Qué grandes proyectos de Data impulsados por Administraciones públicas te parecen más interesantes y exitosos? Puedes pensar en casos en cualquier lugar del mundo

Se están desplegando soluciones de todo tipo en el sector público vinculados al dato. Según un estudio realizado por el Foro Económico Mundial  "el 65% de las entidades gubernamentales encuestadas planeaba adoptar herramientas de inteligencia artificial y el 85% planeaba implementar análisis de big data para 2025". Experiencias de éxito y de gran impacto en resultados han llegado con el seguimiento de la pandemia cruzando datos en tiempo real en países como Taiwan o Corea del Sur. También encontramos algoritmos en Estonia para evaluar y predecir las mejores rutas de éxito para reincorporarse al mercado laboral según el perfil de los desempleados. Sistemas inteligentes de control del tráfico en Amsterdam. 

Y en un ámbito mucho más próximo. Numerosos proyectos en ciudades como Gavà y Mataró para identificar familias de bajos ingresos que son elegibles para beneficios específicos (subvenciones) y realizarles pagos automáticamente en lugar de depender de un proceso de solicitud existente. Herramienta desplegadas por el ayuntamiento de Sant Feliu de Llobregat para la gestión de necesidades y situaciones de vulnerabilidad e inequidad de la población que, a partir del Big Data y de algoritmos de Inteligencia Artificial, permite describir las características sociodemográficas y económicas de las familias del territorio con el objetivo de ayudar a los servicios sociales a conocer mejor las necesidades reales actuales, predecir las futuras, dimensionar la cartera de servicios y planificar los recursos. Algoritmos que predicen incoparecendias de visitas programadas en Hospitales y que sirven para optimizar agendas y reducir listas de espera en el Hospital de Badalona. Algoritmos que sirven para valorar el riesgo de suicidio en las cárceles o de conductas agresivas en las carceles catalanas.

Actualmente eres Chief Data Officer (CDO) en el Hospital de la Santa Creu i Sant Pau de Barcelona. ¿Cuáles son tus grandes responsabilidades? 

Dependiendo del Director de Gestión y de Sistemas de Información mis responsabilidades son: 1) asegurar el acceso a los datos gobernados a todos los usuarios que los necesiten para los diferentes casos de uso 2) mantener y evolucionar la infraestructura de ingesta, almacenamiento, procesado y visualización de datos a la vez que se reduce la deuda tecnológica y 3) evangelizar con casos de uso de todo tipo para avanzar hacia una verdadera cultura del dato.

¿Qué tipo de roles y perfiles hay en tu equipo? 

Somos un equipo de 8 personas que damos servicios y gestionamos proyectos de datos de todo tipo para un hospital de 3.000 profesionales y con un presupuesto anual de más de 400M€. En este equipo tengo analistas, científicos e ingenieros de datos.

Me gustaría también que me contaras un poco el stack de Data y las herramientas que usáis. Me refiero tanto a la parte de Data Warehouse y Data Lake, como a todo lo relacionado la parte de ETL, así como los herramientas analíticas que utilizais y la infraestructura para los proyectos de analítica avanzada (ej. ML-OPS)

Aprobamos una estrategia de datos hace tres años pero la pandemia ha condicionado mucho su despliegue. Actualmente tenemos una arquitectura de BI muy clásico, cargas en batch en entornos SQL con bases de datos relacionales Oracle, herramientas ETL como Pentaho Data Integration (PDI) y herramientas BI como SAP Business Objects y WebFocus (Tibco). Este año  vamos a poder acelerar mucho nuestra estrategia de datos gracias al impulso del nuevo gerente y al nuevo plan director de sistemas de información. En estos momento estamos valorando las distintas soluciones Data Fabric para evolucionar hacia un modelo Data Lakehouse que nos posibilite la puesta en producción de casos de uso fuera de los enfoques más tradicionales: seguimiento de KPIs en tiempo real, entrenamiento de algoritmos de ML, explotación de datos no estructurados etc. En cuanto al gobierno del dato, que para mí es una pieza fundamental de todo el modelo, estamos empezando a trabajar con Anjana Data, una solución que responde bien a nuestras necesidades de glosarios, linaje del dato y flujos de gobierno.

Me consta que una de las iniciativas que has estado liderando es un proyecto de Data Governance. En primer lugar, te voy a pedir tu propia definición de Data Governance

La definición no es mía, es de Nicola Askham, el gobierno del dato es la gestión proactiva de tus datos para ayudar a tu negocio a lograr su estrategia y visión.

¿Y cuales son las claves de éxito de un proyecto de Data Governance? 

El primer paso y absolutamente irrenunciable es ganarse el apoyo explícito de sponsors directivos. Nosotros tenemos la suerte de contar con un gerente, el Dr Comella, absolutamente comprometido con el proyecto. Sin el apoyo convencido de la alta dirección es imposible realizar con éxito este viaje que va a exigir tiempo y dedicación de las personas. Hay que invertir para demostrar que ese tiempo que vamos a pedirle a las personas es tiempo muy bien invertido. Localizar ejemplos concretos, “quick wins”, para convencer a los stakeholders clave del impacto que en términos de competitividad y productividad tiene gobernar el dato.Dedicar tiempo para descubrir tus beneficios particulares, tus objetivos estratégicos, cómo puedes llegar a ellos gobernando el dato y cómo no los alcanzarás si no lo gobiernas.

En mi opinión  también deberíamos  tener claro que Data Governance no es un proyecto, nunca termina, es como la mejora continua en el mundo de la calidad, por tanto es más un proceso de cambio cultural continuo que un proyecto. Consta de numerosas iniciativas y entregables pero como sostiene Nicola Askham entender el DG como un proyecto es un error porque nada sustancial cambiará hasta que la gente no cambie cómo se relaciona con el dato. Dado que la mayoría de organizaciones no son nativas en el mundo del dato, si el DG no aborda el cambio de cultura, y se aborda como un proyecto más, las iniciativas de gobierno de datos nunca brindarán los beneficios que esperamos.

Asociados con el DG hay multitud de retos, así que es muy aconsejable no intentar abordarlos todos al mismo tiempo. Para mí, tiene muchos puntos en común con la gestión por procesos o BPM. Es muy recomendable seleccionar muy bien las iniciativas, iterar y escalar a medida que se consiguen pequeños éxitos. Muchísima comunicación, mucha capacidad de persuasión y paciencia. En DG como en otros procesos de cambio cultural hago mía la màxima del Capità Enciam “Los pequeños cambios son poderosos”.

Hablemos también de las personas necesarias para llevar a cabo un proyecto de Data Governance. ¿Cuáles son los principales roles y responsabilidades? 

Hay que tener muy claro que sin responsables las cosas no suceden nunca. Los propietarios del dato son las figuras más importantes. Siempre son perfiles senior de negocio, nunca de IT. Deben tener autoridad para ordenar cambios, tienen presupuesto y recursos asignados. ¿Cómo los identificamos? Busca la persona que cumpla con la descripción anterior y que sufre más cuando hay problemas con los datos, el primero que levanta la mano cuando algo parece no estar bien porque para él esos datos son vitales. Esa persona también debería tener la autoridad para cambiar los procesos de negocio y para aprobar cambios en funcionalidades en IT. Los (Data) Owner está claro que también deberían ser consumidores de sus datos.

Los administradores de los datos (Data Stewards) son quienes realmente trabajan interactivamente con los datos en su día a día y quienes cumplen lo que el Data Owner pide para tener datos de calidad y fáciles de interpretar. También deberían ser perfiles senior. Si el Director Financiero es el Owner, los Stewards podrían ser el responsable de facturación, el responsable de contabilidad, etc. Deben comunicarse con los productores de datos y hacerles ver que necesitan y la importancia de lo que necesitan. Qué campos son los importantes, qué campos son correctos y qué campos no lo son. Serían los encargados de definir funcionalmente y comunicar los principales KPI a nivel de detalle y las reglas de calidad que requiere el dato.

Finalmente los productores de datos suelen ser técnicos y  administrativos, los responsables del Data Entry. Los propietarios de datos normalmente no se comunican con ellos y ellos no entienden los requerimientos y la importancia del registro. Se les debería dar feedback por parte de los administradores de datos, monitorizando el registro y explicarles lo importante que es para la organización hacerlo correctamente. En un hospital el tema es más complejo, los médicos son productores de datos pero también consumidores, aunque en muchos casos tienen la percepción de que están recogiendo datos que interesan más a la dirección o al financiador que a ellos para su práctica clínica.

En cuanto a los equipos de datos serían al mismo tiempo consumidores y productores de datos, consumen los datos de los transaccionales y producen datos nuevos para su propio consumo o para que otros los puedan consumir. 

Necesitaremos también un Data Governance Manager. Si no hay un responsable del modelo de gobierno, el modelo no funcionará. Él sería el responsable de que el edificio funcione y de que todas las piezas encajen. Custodio del edificio y responsable de evaluar el grado de madurez que tiene nuestra cultura del dato debería proponer una hoja de ruta para alcanzar el nivel deseado. Este es uno de los roles que intento jugar en el Hospital.

¿Y qué herramientas son necesarias para llevar a cabo un proyecto de este tipo?

Es evidente que herramientas de gobierno que incorporen glosario de negocio, linaje del dato, catálogos de datos y temas de monitorización de la calidad del dato facilitan mucho el trabajo pero no son ni de lejos el factor más importante.  Lo más importante de todo es que los actores clave tengan una comprensión de los datos que se utilizan en tu organización y entiendan la importancia de asegurarse de que éstos deberían ser lo más precisos posible.

El otro día me comentabas la dificultad de asignar un ROI a un proyecto de Data Governance. ¿Por qué debería hacerse un proyecto de Data Governance? ¿Cómo convencer al equipo directivo?

Si te vas a apalancar en los datos para tomar mejores decisiones o para automatizar algunos de tus procesos más te vale que esos datos estén bien gobernados y sean de calidad. Los primeros meses de la pandemia nos han dado buenos ejemplos de qué sucede cuando no gobernamos bien los datos. Deberíamos tener el mismo nivel de exigencia en el gobierno del ciclo de vida de los datos de los procesos clave de negocio que tenemos con los datos financieros. Eso es en teoría fácil de entender pero en la realidad es mucho más complicado de lo que parece porque al final vas a pedir que la gente dedique tiempo de sus agendas -que ya están muy apretadas- a este tema. Para convencer no suele funcionar identificar beneficios muy genéricos, hay que aterrizar en proyectos muy concretos. Es importante detectar y escuchar a ese propietario de datos que pide que alguien le ayude con un problema y demostrar al final de la iniciativa como hemos salvado temas de productividad, de reputación y mejorado competitividad con ejemplos muy concretos.

A veces se suele asociar un proyecto de Data Governance con la creación de un Data Lake ¿Qué opinas al respecto?

En mi opinión la construcción de un Data Lake puede ser una buena “excusa” para empezar a gobernar el dato. Siempre es más fácil ordenar la deuda tecnológica cuando arrancamos un nuevo proyecto y la construcción de un Data Lake es para muchas organizaciones un nuevo proyecto. Por otro lado, después de varios años con el “nuevo paradigma” del Data Lake creo que ha quedado claro en la práctica que un repositorio de estas características hace aún más necesario tener mínimamente gobernado el dato sino se corre el peligro de que el lago se convierta en un pantano. 

¿Qué lecturas o contenidos recomiendas para estar al día de las mejores prácticas de Data Governance? 

Recomiendo mucho seguir tanto el blog como los cursos de Nicola Askham, Randy Bean, George Firican, Samir Sharma, Irina Steenbeek. Todos los contenidos que genera el capítulo español de la asociación DAMA. El DMBok2 del que se espera más pronto que tarde una actualización sigue siendo un referente obligatorio para todos los que trabajamos en este tema. 

Cambiemos ahora de tema y volvamos al campo de la Sanidad ¿Qué grandes proyectos relacionados con Data Analytics te parecen más fascinantes? 

En el campo del entrenamiento de algoritmos con imágenes espero cosas impresionantes los próximos años. Ya existen algoritmos que sirven de apoyo al diagnóstico a través de imágenes médicas que manejan métricas de rendimiento más que aceptables en patologías como el glaucoma, la Covid19, el cáncer de piel y de mama metastásico, o situaciones de riesgo como el parto prematuro. 

En salud manejamos muchísimos datos pero en los próximos años vamos a incorporar muchísimos más vía IOT.  Ya es común asegurar la adherencia al tratamiento de los enfermos crónicos como los diabéticos gracias a los Smart Devices. Con la sensorización a gran escala seremos capaces de predecir y prevenir una Sepsis o gestionar aún más proactivamente a los enfermos cuyas condiciones están empeorando antes que requieran ingreso en una UCI. Con los datos de las prescripciones médicas digitalizadas e integradas podremos prevenir efectos adversos por interacciones que en la actualidad están causando muchísimas visitas a urgencias de pacientes polimedicados. 

En el campo de la salud estoy convencido que vamos a asistir, gracias al dato, a una gran transformación los próximos años. Se mejorarán mucho los actuales resultados en términos de experiencia del paciente, resultados poblacionales de salud y reducción de costes. Conseguiremos liberar tiempo de los  profesionales al automatizar parte de las tareas más repetitivas como el registro de datos en la historia clínica a través de la tecnología lo que nos permitirá regresar a una medicina menos industrial, más clínica y más humanizada.

Y ya para ir concluyendo, me gustaría preguntarte qué grandes cambios podemos esperar en el campo de Data Analytics en los próximos 5 años

Para mí, la democratización del dato pasa necesariamente por la democratización de algunas de sus herramientas. Veremos más convicción en la necesidad de gobernar el dato y veremos cada vez herramientas más sencillas de utilizar y más automatizadas para usuarios de negocio. Más autonomía, que no necesariamente supone la desaparición de los especialistas en datos sino todo lo contrario porque estas herramientas permitirán visualizar aún más la importancia de contar con esos especialistas. El Augmented Analytics ha llegado para quedarse y creo que veremos grandes cosas en este nuevo paradigma. Al mismo tiempo estoy convencido de que las arquitecturas en Platform As a Service terminarán por convencer a aquellos que aún no lo ven claro y la nube será la gran protagonista de muchos casos de éxito en sectores muy diferentes.

Anterior
Anterior

Conversación con Enric Quintero

Siguiente
Siguiente

Conversación con Ana Valdivia