24/02/2017

Un projecte de la URV se situa entre els primers del món en una competició d’anàlisi semàntica de text

El projecte Sitaka, presentat pel grup de recerca ITAKA, del Departament d'Enginyeria Informàtica i Matemàtiques de la URV, ha participat en dues categories de la principal competició internacional de sistemes computacionals d'anàlisi semàntica de textos, SemEval. En la d'anàlisi de textos en àrab va quedar en segon lloc d'entre un total de 9 participants del tot el món. I en la d'anàlisi de textos en anglès es va classificar 9è d'entre 39 participants

L'investigador Mohammed Jabreel, treballant amb el sistema Sitaka.

SemEval és la principal competició internacional de sistemes computacionals d’anàlisi semàntica de textos. Enguany, el grup de recerca ITAKA (Intelligent Technologies for Advanced Knowledge Acquisition), del Departament d’Enginyeria Informàtica i Matemàtiques (DEIM) de la URV va participar per primer cop en aquesta competició, que es va fer al gener, i ho va fer en dues categories: anàlisi de textos en àrab i anàlisi de textos en anglès. A totes dues categories es van presentar els resultats del projecte Sitaka (Sentiment Analysis-ITAKA), que està realitzant l’estudiant de doctorat Mohammed Jabreel sota la supervisió de l’investigador del DEIM Antonio Moreno.

De les diferents tasques en què es divideixen les categories, el grup de recerca va participar en la tasca 4, sobre anàlisi de sentiments a twitter i, en concret, en la classificació de la polaritat d’un missatge. L’objectiu era determinar, donat el text d’un tweet, si el missatge que s’està donant és positiu, negatiu o neutral. Aquesta mena d’anàlisi pot tenir un ampli ventall d’aplicacions en moltes àrees, doncs cada cop es fa més palesa la necessitat de disposar d’eines automàtiques d’anàlisi de tot el contingut textual que es genera a la web, especialment a les xarxes socials.

En el cas de l’anàlisi de textos en àrab, el sistema presentat per aquest grup de recerca va quedar en segona posició d’un total de nou participants provienents de tot el món. Els investigadors de la URV van aconseguir una precisió del 56,3% -el sistema guanyador va aconseguir un 58,1%, el que mostra la dificultat d’aquest problema-. En l’anàlisi de textos en anglès, el sistema Sitaka va quedar en novena posició d’un total de 39 participants en termes de precisió, amb un 64,3% (la precisió màxima va ser del 66,4%).

Arxivat a: Centres de recerca, Ciència i tecnologia, ComCiència, Escola Tècnica Superior d'Enginyeria, Recerca
Més notícies de: Antonio Moreno, Departament d'Enginyeria Informàtica i Matemàtiques, ITAKA