07/10/2014
Digue’m d’on ets i et diré què et descarregues
Digue'm d’on ets i et diré què et descarregues. La riquesa d’un país influeix en el tipus de continguts que els usuaris comparteixen i es descarreguen a la xarxa. Un estudi liderat per la URV, en col•laboració amb Northwestern University, troba patrons de comportament predictibles entre les persones que comparteixen fitxers a través del protocol BitTorrent.
Digue'm d’on ets i et diré què et descarregues. La riquesa d’un país influeix en el tipus de continguts que els usuaris comparteixen i es descarreguen a la xarxa. Un estudi liderat per la URV, en col•laboració amb Northwestern University, troba patrons de comportament predictibles entre les persones que comparteixen fitxers a través del protocol BitTorrent.
En concret, l’historial de l’usuari i la riquesa del seu país tenen influència en la tria de continguts a descarregar que fa. És la primera vegada que s’analitza una gran quantitat de dades sobre el comportament dels internautes a l’hora de compartir arxius. L’article s’ha publicat el dilluns, 6 d’octubre a la revista “Proceedings of the National Academy of Sciences” (PNAS).
Gairebé 220.000 fitxers al mes, és a dir, l’equivalent a desenes de terabytes d’informació. Aquest és el volum de dades que han analitzat Jordi Duch, Roger Guimerà (ICREA) i Arnau Gavaldà-Miralles, investigadors de la URV, en col•laboració amb científics de Northwestern University.
Per primera vegada, s’ha estudiat el comportament de les persones que comparteixen arxius peer-to-peer (P2P) a la xarxa mitjançant el protocol BitTorrent. Això ha estat possible gràcies a una mostra de milions d’internautes que, voluntàriament i anònima, han contribuït a l’estudi, permetent que la seva informació fos analitzada.
Els resultats demostren que els usuaris són especialistes en una mena de contingut, enlloc de generalistes. És a dir, que els qui descarreguen pel•lícules sempre descarreguen pel•lícules; els qui descarreguen música sempre descarreguen música… En concret, més de la meitat de les descàrregues de cada internauta eren d’un dels seus dos tipus de continguts preferits. Això, per exemple, “és una amenaça per a la privacitat de l’usuari”, comenta Roger Guimerà, “ja que el seu comportament es torna previsible”.
Per altra banda, els investigadors han trobat que hi ha relació entre el Producte Interior Brut (PIB) del país i el tipus de continguts més descarregats pels usuaris. Així, països amb situacions econòmiques similars descarreguen els mateixos tipus d’arxius. En concret, aquells que viuen una pitjor situació econòmica tendeixen a compartir arxius més grans, com pel•lícules en alta definició; mentre que països amb un PIB més alt comparteixen fitxers més petits, com música. Els motius d’això, per tant, “són socials, no tècnics”, explica Jordi Duch. “El PIB té més poder predictiu que la infraestructura o l’accés a les noves tecnologies”, afegeix Guimerà.
Conèixer aquestes dades pot ser útil per a millorar el protocol d’intercanvi d’arxius P2P i, segons Arnau Gavaldà-Miralles, “es podria aprofitar aquesta fragmentació dels usuaris per millorar l’eficiència dels algoritmes del BitTorrent”. L’estudi també té utilitat a nivell social, pel que fa a la regulació d’aquesta activitat: “Si es volen fer lleis justes, el primer que cal és analitzar el sistema i entendre com funciona, i com l’utilitza la gent”, afegeix Duch.
És la primera vegada que s’analitza el comportament dels usuaris que comparteixen arxius a BitTorrent amb una mostra tan representativa, ja que habitualment aquesta activitat és privada. Per a l’estudi s’han utilitzat dades de 10.000 persones dels darrers cinc anys, tot i que els investigadors tenen informació d’1,4 milions d’internautes.
Per a aconseguir aquest volum d’informació, han utilitzat una extensió anomenada Ono (desenvolupada a Northwestern University), mitjançant la qual es recull la informació dels usuaris, després d’informar-los de l’activitat de recerca i de què hi donin el consentiment. Com a contrapartida, Ono millora el rendiment de l’aplicació i accelera les descàrregues. El procediment de recollida de dades és anònim, ja que l’única informació que s’envia és la mida dels paquets dels arxius, i no l’arxiu en sí; així es pot saber si el fitxer és, per exemple, una cançó, un programa de televisió, o una pel•lícula en alta o en baixa resolució, sense comprometre la privacitat de que el baixa.
El grup treballa ara en utilitzar la informació obtinguda per a modelitzar el comportament dels usuaris i predir-lo; és a dir, intentaran ser capaços d’anticipar les següents descàrregues dels internautes en funció de la informació de la qual disposen. Per altra banda, volen investigar com afecten els fets externs (un canvi a la legislació, el tancament de Megaupload…) al comportament dels usuaris.
Aquesta és la referència bibliogràfica: “Impact of heterogeneity and socio-economic factors on massive decentralized sharing ecosystems”, per Arnau Gavaldà-Miralles et al. I l’Extensió Ono per a BitTorrent aquí.
La imatge de la bola del món representa les connexions entre els usuaris. Cada línia és una connexió entre dos usuaris (un envia i l’altre descarrega). El color correspon a la mida de l’arxiu (un color més clar representa un arxiu més petit, per exemple música; més fosc és un arxiu més gran, com pel·lícules en alta definició).
El mapa amb nodes representa els usuaris. Cada node (punt) és un usuari representatiu. La mida del node respon al número de connexions (i, per tant, de descàrregues). El color correspon a la mida de l’arxiu, com en l’atra imatge. Les imatges són una representació dels resultats de l’estudi, però no són 100% fidels a les xifres obtingudes per facilitar-ne la comprensió.