{"id":29224,"date":"2017-04-26T10:41:30","date_gmt":"2017-04-26T08:41:30","guid":{"rendered":"http:\/\/diaridigital.urv.cat\/?p=29224\/"},"modified":"2017-04-26T11:10:33","modified_gmt":"2017-04-26T09:10:33","slug":"desarrollan-sistema-oculta-automatica-informacion-confidencial-documentos-texto","status":"publish","type":"post","link":"https:\/\/diaridigital.urv.cat\/es\/desarrollan-sistema-oculta-automatica-informacion-confidencial-documentos-texto\/","title":{"rendered":"Desarrollan un sistema que oculta de forma autom\u00e1tica la informaci\u00f3n confidencial de documentos de texto"},"content":{"rendered":"<p>El investigador David S\u00e1nchez, del grupo de investigaci\u00f3n CRISES-C\u00e1tedra UNESCO de Privacidad de Datos, del Departamento de Ingenier\u00eda Inform\u00e1tica y Matem\u00e1ticas de la URV, y la investigadora Montserrat Batet, del grupo de investigaci\u00f3n KISON de la Universitat Oberta de Catalunya, han dise\u00f1ado un sistema que detecta y oculta de forma autom\u00e1tica la informaci\u00f3n confidencial de documentos de texto. De este modo, los documentos se pueden enviar a terceros sin comprometer la privacidad y manteniendo el anonimato de las entidades (personas, organizaciones, etc.) a las que hacen referencia.<\/p>\n<p>Actualmente, los datos personales resultan de gran utilidad en muchos \u00e1mbitos, tanto de investigaci\u00f3n como de negocios o planificaci\u00f3n. Por ejemplo, los datos de pacientes almacenados en historiales m\u00e9dicos son fundamentales para realizar investigaci\u00f3n m\u00e9dica; las operaciones bancarias constituyen la base de los an\u00e1lisis financieros, y el an\u00e1lisis de las transacciones comerciales sirve para mejorar la personalizaci\u00f3n de los servicios que se prestan. Dado que muchos de estos datos son confidenciales, los documentos que los contienen deben protegerse antes de ser enviados a los investigadores. Utilizar mecanismos de protecci\u00f3n adecuados es, por tanto, esencial para garantizar la privacidad o el anonimato de los individuos.<\/p>\n<p>Aunque la legislaci\u00f3n de la Uni\u00f3n Europea es muy estricta en cuanto a la cesi\u00f3n de datos personales sin consentimiento de los implicados, en otros pa\u00edses, como Estados Unidos, es habitual que se requieran y faciliten documentos privados en asuntos judiciales, bajas laborales, seguros, etc. Ahora bien, en todos los casos, se debe garantizar que los documentos facilitados no revelan informaci\u00f3n confidencial que pueda utilizarse, por ejemplo, con fines discriminatorios.<\/p>\n<h5>El sistema elimina o reemplaza<\/h5>\n<p>Hasta ahora, la protecci\u00f3n de documentos confidenciales requer\u00eda de uno o varios expertos que, manualmente, identificaban y eliminaban palabras, sintagmas o frases que pod\u00edan revelar informaci\u00f3n sensible o potencialmente discriminatoria. En este proceso se tienen en consideraci\u00f3n t\u00e9rminos sensibles, como el nombre de una enfermedad contagiosa, y conjuntos de t\u00e9rminos que permitir\u00edan deducir los anteriores indirectamente, como, por ejemplo, combinaciones de medicamentos o tratamientos que se aplican solo en una enfermedad concreta. Trabajar con estos elementos es una tarea ardua y, por su complejidad, no siempre infalible.<\/p>\n<p>El m\u00e9todo que han desarrollado automatiza todo el proceso, lo que permite manejar y proteger de manera eficiente el gran volumen de datos que se utilizan actualmente en investigaci\u00f3n. Para ello, el sistema analiza la informaci\u00f3n disponible en internet, que es la que un tercero podr\u00eda utilizar como base de conocimiento para deducir informaci\u00f3n confidencial de un documento protegido. Seguidamente protege aquellos t\u00e9rminos que podr\u00edan facilitar tales deducciones.<\/p>\n<p>Las pruebas han demostrado que este m\u00e9todo es m\u00e1s exhaustivo y ofrece una precisi\u00f3n equiparable a la de un experto humano. Adem\u00e1s, a diferencia de los expertos, el sistema no se limita a eliminar t\u00e9rminos peligrosos, sino que, en la medida de lo posible, intenta reemplazarlos por conceptos m\u00e1s generales que resulten m\u00e1s ambiguos. Por ejemplo, en lugar de especificar que un paciente tiene una neumon\u00eda, indicar\u00eda que sufre una enfermedad del sistema respiratorio. Con esto se consigue que el documento protegido sea m\u00e1s comprensible y m\u00e1s \u00fatil en los an\u00e1lisis posteriores.<\/p>\n<h5>La implantaci\u00f3n para la investigaci\u00f3n<\/h5>\n<p>De momento, el m\u00e9todo se ha implementado en un prototipo de software que se ha probado con documentos cl\u00ednicos en ingl\u00e9s. Se prev\u00e9 que en un futuro pr\u00f3ximo pueda aplicarse en otros \u00e1mbitos de conocimiento y pueda establecerse como una herramienta de uso profesional de especial utilidad para la investigaci\u00f3n.<\/p>\n<p>La investigaci\u00f3n se enmarca en el proyecto europeo CLARUS, sobre privacidad de datos en la nube, que coordina la URV y que cuenta con la financiaci\u00f3n del programa Horizonte 2020 de la Uni\u00f3n Europea para el per\u00edodo 2015-2017. Asimismo, forma parte del proyecto SmartGlacis: tecnolog\u00edas de seguridad y privacidad para ciudades inteligentes, de la UOC, financiado por el Ministerio de Econom\u00eda y Competitividad.<\/p>\n<p><strong>Referencia bibliogr\u00e1fica:<\/strong> David S\u00e1nchez y Montserrat Batet: \u00abToward sensitive document release with privacy guarantees\u00bb. Engineering Applications of Artificial Intelligence. Volume 59, March 2017, Pages 23-34. DOI: <a href=\"http:\/\/doi.org\/10.1016\/j.engappai.2016.12.013\" target=\"_blank\">10.1016\/j.engappai.2016.12.013<\/a><\/p>\n","protected":false},"excerpt":{"rendered":"<p>El m\u00e9todo ofrece una precisi\u00f3n equiparable al proceso manual que deben hacer actualmente los expertos en privacidad e incluso es m\u00e1s exhaustivo<\/p>\n","protected":false},"author":122,"featured_media":29223,"comment_status":"open","ping_status":"open","sticky":false,"template":"","format":"standard","meta":{"_acf_changed":false,"footnotes":""},"categories":[117,102,244,83,100,123],"tags":[2653,3207,1977],"class_list":["post-29224","post","type-post","status-publish","format-standard","has-post-thumbnail","hentry","category-ciencia-y-tecnologia","category-comunicacion-ciencia","category-escuela-ingenieria","category-general-es","category-investigacion","category-notas-prensa","tag-catedra-unesco-de-privacidad-de-datos","tag-david-sanchez","tag-privacidad-de-datos"],"acf":[],"_links":{"self":[{"href":"https:\/\/diaridigital.urv.cat\/es\/wp-json\/wp\/v2\/posts\/29224","targetHints":{"allow":["GET"]}}],"collection":[{"href":"https:\/\/diaridigital.urv.cat\/es\/wp-json\/wp\/v2\/posts"}],"about":[{"href":"https:\/\/diaridigital.urv.cat\/es\/wp-json\/wp\/v2\/types\/post"}],"author":[{"embeddable":true,"href":"https:\/\/diaridigital.urv.cat\/es\/wp-json\/wp\/v2\/users\/122"}],"replies":[{"embeddable":true,"href":"https:\/\/diaridigital.urv.cat\/es\/wp-json\/wp\/v2\/comments?post=29224"}],"version-history":[{"count":0,"href":"https:\/\/diaridigital.urv.cat\/es\/wp-json\/wp\/v2\/posts\/29224\/revisions"}],"wp:featuredmedia":[{"embeddable":true,"href":"https:\/\/diaridigital.urv.cat\/es\/wp-json\/wp\/v2\/media\/29223"}],"wp:attachment":[{"href":"https:\/\/diaridigital.urv.cat\/es\/wp-json\/wp\/v2\/media?parent=29224"}],"wp:term":[{"taxonomy":"category","embeddable":true,"href":"https:\/\/diaridigital.urv.cat\/es\/wp-json\/wp\/v2\/categories?post=29224"},{"taxonomy":"post_tag","embeddable":true,"href":"https:\/\/diaridigital.urv.cat\/es\/wp-json\/wp\/v2\/tags?post=29224"}],"curies":[{"name":"wp","href":"https:\/\/api.w.org\/{rel}","templated":true}]}}