31/01/2020

L’algoritme més humà

Investigadors de la URV i ICREA han dissenyat un algoritme capaç d'identificar automàticament models matemàtics que, a més de millorar la fiabilitat de les prediccions que fan, aporten informació per comprendre les dades, com ho faria un científic

A partir d’unes dades que se li donen (punts), el robot científic és capaç de trobar la llei que millor les descriu (superfície blava) i la seva expressió matemàtica exacta.

Predir quin serà el millor candidat per rebre un trasplantament d’òrgans, saber si el client d’un banc tornarà el préstec que vol demanar, conèixer la taxa de curació d’un medicament, encertar les pel•lícules que millor encaixen amb els interessos dels consumidors o, fins i tot, triar la parella ideal per a una persona que en busca. Els algoritmes matemàtics analitzen constantment milions de dades, identifiquen patrons i fan prediccions que s’apliquen a qualsevol àmbit de la vida. Però en la majoria dels casos els resultats no van més enllà de donar una predicció tancada, que no es pot interpretar i moltes vegades està condicionada per biaixos que ja existeixen en les mateixes dades d’origen. Ara, un equip investigador del grup de recerca SEES:lab, del Departament d’Enginyeria Química de la Universitat Rovira i Virgili i ICREA, ha fet un pas endavant amb el desenvolupament d’un nou algoritme que fa prediccions més acurades i genera models matemàtics que, a més, permeten comprendre aquestes prediccions. Els resultats d’aquesta recerca els acaba de publicar la revista Science Advances.

“L’objectiu del nostre estudi era crear el que anomenem un robot científic, és a dir, un algoritme que pugui aplicar el coneixement i l’expertesa que té un investigador a l’hora d’interpretar les dades”, explica Marta Sales-Pardo, una de les autores d’aquesta recerca. Els resultats que aporta l’algoritme tenen la particularitat que són interpretables. “És com si algú hagués elaborat una llei o una teoria sobre el sistema que s’està estudiant. L’algoritme et dona les relacions matemàtiques que hi ha entre les variables que ha analitzat i ho fa de forma autònoma”, afegeix Roger Guimerà, investigador ICREA del mateix grup.

D’esquerra a dreta, Jordi Pallarès, Roger Guimerà, Marta Sales-Pardo i Ignasi Reichard, autors de l’estudi.

Quan una empresa té moltes dades i les vol explotar, pot fer-ho contractant una persona experta que provi diferents models, proposi fórmules i miri quina funciona millor a partir dels diversos experiments que haurà de fer per validar-les. Amb això obtindrà una fórmula matemàtica que permetrà modelitzar el sistema, però implicarà una inversió important de temps i diners. Una altra possibilitat és recórrer a una persona especialista en aprenentatge automàtic (machine learning), una disciplina científica de l’àmbit de la intel•ligència artificial que crea sistemes que identifiquen patrons complexos entre milions de dades, aprenen de forma automàtica i donen com a resultat un model de «caixa negra» que permet fer prediccions. Però aquests sistemes no aporten cap altra informació i si la predicció falla no es podrà saber on s’ha produït l’error ni què es pot fer per evitar-lo. L’algoritme desenvolupat a la URV agafa el millor de tots dos casos: processa les dades de forma automàtica, ràpida i fiable, com fa el sistema d’aprenentatge automàtic, i a més dona com a resultat un model interpretable, com ho faria el científic.

L’algoritme es pot aplicar per analitzar i interpretar dades de qualsevol àmbit en un procés molt més àgil i eficient dels que existeixen fins ara. Però el veritable valor afegit és la informació que aquest sistema aporta. “En l’àmbit de la medicina, per exemple, si has de prendre una decisió basada en dades és molt important conèixer el perquè de cada decisió i quin és el risc de fallar”, explica Guimerà. “Tot i que aquest algoritme també ha demostrat que és molt precís, el més important és la possibilitat de comprendre’n els resultats, d’haver desenvolupat un científic automàtic que és capaç, sense cap coneixement previ, d’agafar una sèrie de dades i desenvolupar una teoria que resol el problema que se li plantegi”, afegeix Ignasi Reichardt, també investigador de l’equip.

En aquest estudi, l’algoritme s’ha aplicat a un problema fonamental de física de fluids amb la col•laboració del grup de recerca Experimentació, Computació i Modelització en Mecànica de Fluids i Turbulència del Departament d’Enginyeria Mecànica de la URV.

Referència bibliogràfica: R. Guimerà, I. Reichardt, A. Aguilar-Mogas, F. A. Massucci, M. Miranda, J. Pallarès, M. Sales-Pardo, A Bayesian machine scientist to aid in the solution of challenging scientific problems. Sci. Adv. 6, eaav6971 (2020). DOI: 10.1126/sciadv.aav6971

Arxivat a: Ciència i tecnologia, ComCiència, Departament d'Enginyeria Mecànica, Departament d'Enginyeria Química, Escola Tècnica Superior d'Enginyeria Química, Grups de recerca, Recerca
Més notícies de: SEES:lab