24/11/2016

Prediccions ràpides i el doble de precises

Amb cada vegada més informació en línia disponible, modelitzar les preferències dels usuaris per millorar l’assessorament en determinats productes és cada cop més important. Investigadors de la URV han creat un nou algoritme que millora el resultat de les prediccions respecte als algoritmes existents. El poder d’aquest nou enfocament rau en la capacitat que té per copsar els matisos dels usuaris a l’hora de triar-ne les preferències, ja que, al contrari del que passa en les eines existents, un individu no està vinculat a un grup amb les mateixes preferències, sinó que cada persona té flexibilitat per pertànyer a diferents grups

Statistics Business Background

Preferències en llibres, pel·lícules, sèries o fins i tot cites. Els usuaris de les plataformes estan acostumats a rebre informacions de propostes relacionades amb les que un algoritme considera que són les seves preferències, amb un encert més o menys acceptable. Les bones prediccions permeten millorar l’assessorament als usuaris i entendre millor els processos sociopsicològics que les determinen, i això és el que han fet ara investigadors del grup de recerca SEES:lab (Science and Engineering of Emerging Systems) de la URV. Han desenvolupat un nou algoritme que permet assessorar millor els usuaris i calculen que gairebé duplica la millora en precisió dels sistemes existents fins ara respecte als algoritmes de recomanació senzills.

Marta Sales i Roger Guimerà, dos de los autores del artículo, investigadores del grupo SEES:lab — Marta Sales i Roger Guimerà, dos de los autors del l’article, investigadors del Departament d’Enginyeria Química de la URV.

Antonia Godoy, Roger Guimerà i Marta Sales, investigadors del Departament d’Enginyeria Química de la Universitat Rovira i Virgili, amb la col·laboració de Cristopher Moore, de l’Institut Santa Fe, han creat un model de filtratge col·laboratiu, amb un algoritme associat escalable, que fa que les prediccions de preferències dels individus siguin precises. El nou enfocament es basa en el supòsit explícit que hi ha, d’una banda, grups de persones i grups d’objectes, i, d’una altra banda, les preferències d’un individu per un objecte no les determina únicament la seva pertinença a un grup. La nova eina preveu que cada individu i cada element puguin pertànyer simultàniament a mescles de diferents grups i, a diferència de molts enfocaments populars, els investigadors no assumeixen implícitament o explícitament que els individus en cada grup prefereixen objectes d’un sol grup d’elements. Aquest algoritme pot predir els grups resultants que se superposen i les preferències, ja que, en grans conjunts de dades, permet discriminar les preferències individuals d’una manera més precisa que els algoritmes actuals.

D’algoritmes n’hi ha molts, i molts són ràpids i amb resultats raonables, però moltes vegades els models que tenen al darrere no són gaire realistes. Es basen sobretot a classificar les persones per grups —segons les seves preferències— i a predir segons el comportament del grup al qual vinculen una persona determinada. Per tant, les prediccions corresponen a allò que agrada al grup, o no, però no responen als patrons de comportament de les persones perquè no tenen en compte els matisos. Per això, aquest models no són capaços de reproduir els models de comportament de la població .

El model que hi ha al darrere del nou sistema és més sofisticat i respon de manera més correcta a com funcionen realment les persones; per tant, a diferència dels models actuals, és més flexible i permet reproduir els patrons de comportament d’una població en conjunt. És un model que ja se sabia que proporcionava millors prediccions, però fins ara era molt lent i no es podia aplicar a grans bases de dades. En l’article científic que acaben de publicar a la revista Proceedings of the National Academy of Sciences of the United States of America, els investigadors de la URV han aconseguit el millor dels dos mons: un model ràpid i escalable, que, alhora, respon més bé a com la gent pren les decisions.

Referència bibliogràfica: Antonia Godoy-Lorite, Roger Guimera, Cristopher Moore, Marta Sales-Pardo “Accurate and scalable social recommendation using mixed-membership stochastic block models” PNAS 2016 ; published ahead of print November 23, 2016, doi:10.1073/pnas.1606316113.

Subscriu-te als butlletins de la URV

Arxivat a: Ciència i tecnologia, ComCiència, Escola Tècnica Superior d'Enginyeria Química, Recerca
Més notícies de: Marta Sales, Roger Guimerà, SEES:lab, xarxes complexes