24/11/2016

Predicciones rápidas y el doble de precisas

Cada día hay más información en línea disponible y modelar las preferencias de los usuarios para mejorar el asesoramiento en determinados productos es cada vez más importante. Investigadores de la URV han modelado un nuevo algoritmo que mejora el resultado de las predicciones respecto a los algoritmos existentes. El poder de este nuevo enfoque recae en su capacidad para tener en cuenta los matices de los usuarios cuando eligen sus preferencias puesto que, a diferencia de las herramientas existentes, no vincula un individuo a un grupo con las mismas preferencias, sino que cada persona tiene flexibilidad para pertenecer a diferentes grupos

Preferencias en libros, películas, series o incluso citas. Los usuarios de las plataformas están acostumbrados a recibir sugerencias relacionadas con las que un algoritmo considera que son sus preferencias, con un acierto más o menos aceptable. Las buenas predicciones permiten mejorar el asesoramiento a los usuarios y obtener una mejor comprensión de los procesos socio-psicológicos que las determinan. Y esto es lo que han hecho ahora investigadores del grupo Sees:lab -Science and Engineering of Emerging Systems- de la URV. Han desarrollado un nuevo algoritmo que permite mejorar el asesoramiento a los usuarios y calculan que, prácticamente, duplica la mejora en precisión de los sistemas existentes respecto algoritmos de recomendación sencillos.

Marta Sales i Roger Guimerà, dos de los autores del artículo, investigadores del grupo SEES:lab
Marta Sales y Roger Guimerà, dos de los autores del artículo, investigadores del Departamento de Ingeniería Química de la URV.

Antonia Godoy, Roger Guimerà y Marta Sales, del Departamento de Ingeniería Química de la Universitat Rovira i Virgili, con la colaboración de Cristopher Moore, del Santa Fe Institute, han desarrollado un modelo de filtrado colaborativo, con un algoritmo asociado escalable, que hace que las predicciones de preferencias de los individuos sean precisas. El nuevo enfoque se basa en el supuesto explícito de que, por un lado, hay grupos de personas y grupos de objetos y que la preferencia de un individuo por un objeto no está determinada únicamente por su pertenencia a un grupo. La nueva herramienta prevé que cada individuo y cada elemento puedan pertenecer simultáneamente a una mezcla de diferentes grupos y, a diferencia de los enfoques populares, los investigadores no asumen implícitamente o explícitamente que los individuos en cada grupo prefieren objetos de un solo grupo de elementos.

Este algoritmo puede predecir tanto los grupos resultantes que se superponen como las sugerencias que se predicen, ya que permite predecir las preferencias individuales en grandes conjuntos de datos, de una manera más precisa que los algoritmos actuales. Existen algoritmos, algunos de los cuales son rápidos y con resultados razonables, pero a veces los modelos que tienen detrás no son demasiado realistas. Se basan principalmente en clasificar a las personas por grupos –según sus preferencias- y haciendo las predicciones en relación al comportamiento del grupo al que se vinculan. Por lo tanto, las predicciones no responden a los patrones de comportamiento de las personas porque no tienen en cuenta los matices. Como consecuencia, estos modelos no son capaces de reproducir los modelos de comportamiento de la población.

El modelo que hay detrás del nuevo sistema es más sofisticado y responde de forma más correcta al funcionamiento real de los individuos y, por tanto, es más flexible y permite reproducir los patrones de comportamiento de una población en conjunto. Los investigadores eran conocedores de que este modelo que ahora han desarrolado daba mejores predicciones pero hasta el momento era muy lento y no se podía aplicar en bases de datos grandes.

En el artículo científico que acaban de publicar en la revista Proceedings of the National Academy of Sciences of the USA han conseguido el mejor de los dos mundos: un modelo rápido y escalable y que, a la vez, responde mejor a cómo la gente toma las decisiones.

Referencia bibliográfica: Antonia Godoy-Lorite, Roger Guimera, Cristopher Moore, Marta Sales-Pardo “Accurate and scalable social recommendation using mixed-membership stochastic block models” PNAS 2016 ; published ahead of print November 23, 2016, doi:10.1073/pnas.1606316113.

Print Friendly, PDF & Email

Comenta

*