27/04/2016

Investigadores de la URV defienden la eficacia de las técnicas que mantienen los datos personales en el anonimato

David Sánchez, Sergio Martínez y Josep Domingo-Ferrer defienden la eficacia de las técnicas actuales para conseguir que los datos personales se mantengan anónimos cuando se utilizan en la investigación científica. En un artículo aparecido en la revista Science, los investigadores de la URV demuestran que los mecanismos disponibles para garantizar el anonimato, fruto de investigaciones previas y, en algunos casos, propuestos por ellos mismos, son eficaces y válidos para proteger la identidad de las personas

Los investigadores Sergio Martínez, David Sánchez y Josep Domingo-Ferrer.
Los investigadores Sergio Martínez, David Sánchez y Josep Domingo-Ferrer.

Actualmente, los datos personales resultan de gran utilidad en muchos ámbitos, tanto en la investigación como en los negocios o la planificación. Por ejemplo, los almacenados en los historiales médicos de los pacientes son fundamentales para hacer investigación médica, las operaciones bancarias constituyen la base de los análisis financieros, y las transacciones comerciales permiten mejorar la personalización de los servicios que se prestan. Los investigadores reciben esta información de forma anónima, para que la puedan utilizar sin comprometer la privacidad de los individuos a que hacen referencia los datos. Emplear mecanismos adecuados de anonimización es, por tanto, esencial para garantizar el anonimato y evitar la reidentificación de las personas.

A este respecto, los investigadores del grupo de investigación CRISES-Cátedra UNESCO de privacidad de datos, del Departamento de Ingeniería Informática y Matemáticas de la URV, muestran en el trabajo publicado en Science que las personas a las que se refieren los datos anónimos realmente mantienen el anonimato. Consideran que los mecanismos que existen para anonimizar los datos personales son fiables y adecuados, de modo que pueden utilizarse en investigación con plenas garantías de que las personas a las que corresponden no serán reidentificadas.

Protecció de dades personals

Este artículo ha venido motivado por la publicación, también en la revista Science, en enero de 2015, de “Unique in the shopping mall: on the reidentifiability of credit card metadata”, un artículo elaborado por investigadores del Instituto de Tecnología de Massachusetts (MIT), de la Universidad de Aarhus y de la Universidad Rutgers (Nueva Jersey), en el que se criticaban los métodos de anonimización y se cuestionaba la viabilidad de publicar información personal para hacer investigación. Los autores aseguraban que los individuos podían reidentificarse y que, por tanto, su privacidad podía verse comprometida a partir de la combinación de valores de atributos únicos disponibles en una base de datos, a pesar de haber aplicado un mecanismo de anonimización basado en generalizar de forma independiente los valores de estos atributos.

Los investigadores del MIT y de las universidades de Aarhus y Rutgers hicieron extensiva la ineficacia del sistema que utilizaron a todos los mecanismos de anonimización, e ignoraron de este modo los trabajos científicos que se han venido publicando en el área de la protección de datos en los últimos cuarenta años. Concluyeron que los mecanismos existentes están obsoletos y son inadecuados, e instaron a los depositarios de los datos a no hacerlos públicos, lo que sería «catastrófico para la investigación en muchos ámbitos», según los investigadores de la URV.

A raíz de la repercusión que tuvo este artículo, los investigadores de la URV, expertos en privacidad de datos, han puesto de manifiesto en su réplica el desconocimiento del estado de la técnica en protección de datos por parte de los autores del artículo. Asimismo, han criticado que los investigadores del MIT y de las universidades de Aarhus y Rutgers hayan considerado ineficaces todos los métodos de anonimización, a partir de un método defectuoso diseñado por los propios autores.

Métodos para evitar la reidentificación

Para defender la eficacia de los métodos de anonimización de datos, los investigadores de la URV se han basado en las investigaciones científicas sobre la materia publicadas en los últimos años y, mediante un modelo de anonimato llamado k-anonymity y un mecanismo propio de protección basado en microagregación de datos, han logrado eliminar cualquier combinación de valores únicos de una base de datos —lo que evita la reidentificación unívoca de individuos— y, al mismo tiempo, han conseguido que los datos mantuvieran su utilidad analítica.

En su artículo, además, han puesto sobre la mesa otros escenarios más complejos y actuales, como la anonimización de macrodatos (big data) o de datos que se generan dinámicamente, o la anonimización controlada por los propios individuos (anonimización colaborativa o co-útil). A este respecto, han dejado claro que existen soluciones capaces de garantizar la privacidad también en este escenario, aunque hay que seguir investigando para mejorar su eficacia.

En las conclusiones de su artículo, los investigadores de la URV defienden de manera contundente que los depositarios de la información personal pueden confiar en la anonimización, que, en cualquier caso, resulta esencial, pues «estos datos son muy necesarios para hacer investigación».

Referencia bibliográfica: David Sánchez, Sergio Martínez y Josep Domingo-Ferrer: «Comment on ‘Unique in the shopping mall: On the reidentifiability of credit card metadata'». Science. DOI: 10.1126/science.aad9295

Print Friendly, PDF & Email

Comenta

*