¿Cómo llegaron a trabajar con los datos en el sistema de salud?
Inicialmente mi equipo y yo estábamos interesados en desarrollar un nuevo modelo matemático y buscamos dónde aplicarlo, en qué datos podría tener aplicación.
Uno de los coautores sugirió el caso de la gripe, con la intención de anticiparse a su pico más fuerte, cuando cada vez más pacientes con la enfermedad acuden a los hospitales y centros de salud, y saturan los servicios. Normalmente los servicios de salud no están preparados para recibir estas avalanchas y se ven desbordados.
Nosotros lo que hicimos, además del sistema tradicional de predecir el punto más alto de la gripe que sólo utiliza los datos históricos, empezamos a considerar variables climáticas que podrían disparar ese pico.
Del análisis de los datos encontramos que cuando hay varios días por debajo de los 10 grados, el pico de la gripe se anticipa una o dos semanas. Este dato es mucho mejor que el que había antes pues antes teníamos que esperar que viniera la primer avalancha para predecir que, debido al contagio, vendría una nueva avalancha de gente en algunos días. De esta manera se puede corregir la predicción y establecer que si estamos por debajo de esa temperatura, en una o dos semanas vendrán muchas más personas al servicio de salud.
Si se prevé un episodio de alta incidencia, se pueden reforzar los servicios de urgencia.
¿Qué alcance tiene este sistema de alerta?
Nuestra búsqueda de aplicar el modelo matemático se unió con el problema de los servicios de salud de Cataluña que se saturaban en los momentos más altos de la enfermedad. Ahora se está implementando en Cataluña, como una información online actualizada que le proporcionamos a los servicios de salud para que puedan estar preparados. Próximamente lo instalaremos en Galicia, donde ya tenemos todos los datos.
En Cataluña se ha suscrito un convenio con la Agencia Catalana de Salud, que cada semana publica un documento con la predicción para los siguientes siete días. Desde la temporada epidémica 2016-2017 se está publicando semanalmente en la web de la Generalitat este documento.
¿En qué otros campos trabajas además de la salud?
Yo soy estadístico y la estadística se aplica realmente a todo. Detrás de cada procedimiento científico tiene que haber una validación estadístico-matemática.Tenemos proyectos sobre prevención de incendios, finanzas, y hasta sobre cómo gestionar las flotas que los apagan, o el mantenimiento predictivo de equipos en la industria. Intentamos predecir cuándo puede estropearse un equipo que está funcionando en una industria y anticiparnos para hacerle un mantenimiento preventivo antes de que eso ocurra.
El conocimiento que tú utilizas se emplea en este caso para prevenir epidemias, pero el mismo conocimiento se puede utilizar por ejemplo a la inversa, para hacer un mal uso de manera más eficaz. ¿Te preocupa esa dualidad?
Como persona siempre te preocupa que cualquier cosa que desarrolles se utilice mal, pero nosotros tenemos claro que desarrollamos herramientas. Y una herramienta como el martillo puede ser utilizada para clavar un clavo o para romper una ventana. No vamos a dejar de utilizar el martillo.
Lo que vemos en esto del Big Data es que hay muy poca regulación todavía. La sociedad tiene que evolucionar hacia conseguir una regulación más estricta respecto a qué se puede medir, con el consentimiento de los usuarios. Tiene que avanzar en este tipo de regulación. Yo creo que estamos en una fase muy inicial en ese sentido.
Tú cuando te creas una cuenta de Facebook estás firmando un consentimiento. A lo mejor ese consentimiento es abusivo, y con ese consentimiento abusivo Facebook puede venderle esos datos a un tercero y ese otro puede utilizar la herramienta de la peor manera posible. Habrá que ver qué tipo de regulación se impone para las nuevas fuentes de datos.
¿En qué se diferencia en este sentido el Big Data de la estadística clásica?
La estadística clásica y pública ya tiene las limitaciones de consentimiento entre partes, anonimato, no utilizar esa información para los fines que no fue concebida, etcétera. Con el Big Data las reglas no están tan claras.
Yo no tengo redes sociales, y creo que mi dispositivo me conoce mejor que mi mujer. Tienes cuentas de correo, tienes la de Google, te conoce tu correo, por dónde navegas, tiene un servicio que conoce tu historial, que infiere qué tipo de cosas te gustan, de qué tipo eres. Esto en malas manos puede servir para que te manden mensajes dirigidos para manipularte.
Esto era una problema ético ya en la estadística clásica. Por ejemplo, que una póliza de salud quiera saber tu información personal, o que una compañía de seguros quiera saber todo tu historial de salud anterior. Uno se pregunta si es ético o no es ético. Una compañía de seguros te podría decir que te rebaja la prima de seguros si te pones uno de estos relojes mide pasos y si haces diez mil pasos al día. ¿Ésto es ético o no? Capaz que es mejor, porque si yo hago esos diez mil pasos tendré menos propensión a la enfermedad y el seguro se adapta mejor a lo que yo digo, pero también es cierto que puede venir alguien que no quiera adherirse a ese tipo de programa, y la empresa, en una mala praxis, diga que no le ofrecerá ningún seguro o le ofrezca una prima excesivamente cara para disuadirle de que firme. Aquí siempre hay una parte en el borde, siempre está la duda ética.
Desde mi punto de vista, esto ha sido desde siempre, desde la estadística clásica con datos pequeños que tiene la empresa. Claro que ahora se agranda porque hay muchos datos nuestros en manos de otros, datos que incluso nosotros no conocemos.
¿Pueden mentir los datos?
Los datos no tienen alma. Los que tienen alma son los que lo recogen o los filtran. Quien te miente es quien los recoge o los filtra, o el procedimiento con el cual los recoge.
También es cierto que los datos se tratan con métodos matemáticos o estadísticos que no están al alcance de la población en general, entonces a veces se usa ese desconocimiento de la población de lo datos y procedimientos estadísticos para manipular los resultados, y es común que tu veas a la gente decir que con estos datos la conclusión es esta y con estos mismos datos otro te dice que la conclusión es otra. Porque se aprovechan de que la gente no es capaz de discernir entre la verdad de los datos y la manipulación que impone el analista. Los datos no mienten; mienten los que los trabajan.
¿Son el petróleo del futuro?
Seguramente se van a considerar como un activo financiero en el futuro. Quien tiene la información, tiene el poder y esto lo que hace al igual que un método estadístico, es extraer información de los datos. Extraer poder para tomar mejores decisiones y quien toma mejores decisiones, gana.