{"id":105812,"date":"2023-03-14T10:01:56","date_gmt":"2023-03-14T09:01:56","guid":{"rendered":"https:\/\/diaridigital.urv.cat\/?p=105812"},"modified":"2023-03-14T10:39:43","modified_gmt":"2023-03-14T09:39:43","slug":"descubren-limitaciones-fundamentales-en-el-aprendizaje-automatico-de-modelos-matematicos","status":"publish","type":"post","link":"https:\/\/diaridigital.urv.cat\/es\/descubren-limitaciones-fundamentales-en-el-aprendizaje-automatico-de-modelos-matematicos\/","title":{"rendered":"Descubren limitaciones fundamentales en el aprendizaje autom\u00e1tico de modelos matem\u00e1ticos"},"content":{"rendered":"<p>El aprendizaje autom\u00e1tico est\u00e1 detr\u00e1s de muchas de las decisiones que se toman en el d\u00eda a d\u00eda. La aparici\u00f3n de anuncios personalizados en Internet, la recomendaci\u00f3n de contactos y contenidos en las redes sociales, o las estimaciones de la probabilidad de que un medicamento o un tratamiento funcione en determinados pacientes son algunos ejemplos. Esta rama de la inteligencia artificial se basa en el desarrollo de modelos capaces de procesar grandes cantidades de datos, aprender de forma autom\u00e1tica e identificar patrones complejos que permitan realizar predicciones. Pero debido a la complejidad y elevado n\u00famero de par\u00e1metros de estos modelos, cuando un algoritmo de aprendizaje autom\u00e1tico funciona mal o se detecta un comportamiento err\u00f3neo, a menudo es imposible identificar el motivo. De hecho, incluso cuando funcionan como se espera, es dif\u00edcil entender por qu\u00e9.<\/p>\n<p>Una alternativa a estos modelos de \u201ccaja negra\u201d, cuyo comportamiento es dif\u00edcil o imposible de controlar, es utilizar el aprendizaje autom\u00e1tico para desarrollar modelos matem\u00e1ticos interpretables. Esta alternativa cobra cada vez mayor relevancia entre la comunidad cient\u00edfica. Sin embargo, ahora un equipo investigador del grupo de <a href=\"http:\/\/seeslab.info\/\">SEES Lab de la Universitat Rovira i Virgili<\/a> ha confirmado, en un estudio publicado en la revista <em>Nature Communications<\/em>, que en algunas ocasiones nunca se podr\u00e1n identificar modelos interpretables a partir s\u00f3lo de datos.<\/p>\n<p>Los modelos matem\u00e1ticos interpretables no son ninguna novedad. Durante siglos y hasta el d\u00eda de hoy, la comunidad cient\u00edfica ha descrito los fen\u00f3menos naturales mediante modelos matem\u00e1ticos relativamente simples, como la ley de la gravitaci\u00f3n de Newton, por ejemplo. A veces se llegaba a estos modelos de forma deductiva, partiendo de consideraciones fundamentales. Otras, las m\u00e1s frecuentes, la forma de conseguir estos modelos era de forma inductiva, a partir de datos.<\/p>\n<p>Actualmente, con la gran cantidad de datos disponibles para cualquier tipo de sistema, los modelos interpretables se pueden identificar tambi\u00e9n mediante el aprendizaje autom\u00e1tico. De hecho, el propio equipo investigador dise\u00f1\u00f3 en 2020 un <a href=\"https:\/\/diaridigital.urv.cat\/es\/el-algoritmo-mas-humano\/\">\u201crobot cient\u00edfico\u201d<\/a>, es decir, un algoritmo capaz de identificar autom\u00e1ticamente modelos matem\u00e1ticos que, adem\u00e1s de mejorar la fiabilidad de sus predicciones, aportan informaci\u00f3n para comprender los datos, al igual que un cient\u00edfico. Ahora ha dado un paso m\u00e1s con su investigaci\u00f3n y ha podido demostrar, gracias precisamente a este \u00abrobot cient\u00edfico\u00bb, que \u00aben ocasiones no es posible averiguar el modelo matem\u00e1tico que realmente rige el comportamiento de un sistema\u00bb, explica Marta Sales -Pardo, catedr\u00e1tica del Departamento de Ingenier\u00eda Qu\u00edmica de la URV, que ha participado en la investigaci\u00f3n.<\/p>\n<figure id=\"attachment_98992\" aria-labelledby=\"figcaption_attachment_98992\" class=\"wp-caption alignnone\" style=\"width: 1024px\"><a href=\"https:\/\/diaridigital.urv.cat\/wp-content\/uploads\/2022\/07\/DSC08723-scaled.jpg\"><img loading=\"lazy\" decoding=\"async\" class=\"size-large wp-image-98992\" src=\"https:\/\/diaridigital.urv.cat\/wp-content\/uploads\/2022\/07\/DSC08723-1024x576.jpg\" alt=\"\" width=\"1024\" height=\"576\" srcset=\"https:\/\/diaridigital.urv.cat\/wp-content\/uploads\/2022\/07\/DSC08723-1024x576.jpg 1024w, https:\/\/diaridigital.urv.cat\/wp-content\/uploads\/2022\/07\/DSC08723-300x169.jpg 300w, https:\/\/diaridigital.urv.cat\/wp-content\/uploads\/2022\/07\/DSC08723-768x432.jpg 768w, https:\/\/diaridigital.urv.cat\/wp-content\/uploads\/2022\/07\/DSC08723-1536x864.jpg 1536w, https:\/\/diaridigital.urv.cat\/wp-content\/uploads\/2022\/07\/DSC08723-2048x1152.jpg 2048w\" sizes=\"auto, (max-width: 1024px) 100vw, 1024px\" \/><\/a><figcaption id=\"figcaption_attachment_98992\" class=\"wp-caption-text\">Roger Guimer\u00e0 y Marta-Sales Pardo han liderado la investigaci\u00f3n.<\/figcaption><\/figure>\n<h5>La importancia del ruido<\/h5>\n<p>Todos los datos que se puedan obtener de un sistema tienen \u201cruido\u201d, es decir, sufren distorsiones o peque\u00f1as fluctuaciones, que ser\u00e1n diferentes cada vez que se mida. Si los datos tienen poco ruido, un robot cient\u00edfico identificar\u00e1 un modelo claro que, puede demostrarse, es el modelo correcto para los datos. Pero cuanto mayor sea esta variabilidad, m\u00e1s dif\u00edcil es descubrir el modelo correcto, ya que el algoritmo puede dar como resultado m\u00e1s de un modelo que podr\u00eda ajustarse bien a los datos. \u00abCuando esto ocurre hablamos de incertidumbre del modelo, ya que no podemos estar seguros de cu\u00e1l es el correcto\u00bb, explica Roger Guimer\u00e0, investigador ICREA del mismo grupo de investigaci\u00f3n.<\/p>\n<p>Ante esta incertidumbre la clave es utilizar un enfoque riguroso, llamado bayesiano, que consiste en utilizar la teor\u00eda de la probabilidad sin aproximaciones. \u201cNuestro estudio confirma que existe un nivel de ruido a partir del cual ning\u00fan mecanismo conseguir\u00e1 descubrir el modelo correcto. Es una cuesti\u00f3n de teor\u00eda de probabilidad: muchos modelos son igual de buenos para los datos, y no podremos saber cu\u00e1l es el correcto\u201d, concluye el investigador. Por ejemplo, si los term\u00f3metros para medir temperatura atmosf\u00e9rica tuvieran errores de lectura de m\u00e1s\/menos 20 grados cent\u00edgrados, ser\u00eda imposible desarrollar buenos modelos meteorol\u00f3gicos, y un modelo de predicci\u00f3n que dijera que siempre estamos a 10 grados (m\u00e1s\/menos 20) ser\u00eda tan \u00abbueno\u00bb como un modelo m\u00e1s detallado que prev\u00e9 subidas y bajadas de la temperatura.<\/p>\n<p>Los resultados de este estudio desmontan la idea que hasta ahora se ten\u00eda de que a partir de los datos siempre es posible encontrar el modelo matem\u00e1tico que los describe. Ahora se demuestra que si no se tienen suficientes datos o \u00e9stos tienen demasiado ruido esto ser\u00e1 imposible, incluso cuando este modelo correcto sea sencillo. \u00abEstamos ante una limitaci\u00f3n fundamental del aprendizaje autom\u00e1tico: los datos no tienen por qu\u00e9 ser suficientes para ver lo que est\u00e1 pasando en un sistema concreto\u00bb, concluye el investigador.<\/p>\n<p><b><span data-contrast=\"auto\">Referencia bibliogr\u00e1fica:<\/span><\/b> <span data-contrast=\"none\">Fundamental limits to learning closed-form mathematical models from data. <\/span><span data-contrast=\"none\">Oscar Fajardo-Fontiveros, Ignasi Reichardt, Harry R. De Los R\u00edos, Jordi Duch, Marta Sales-Pardo &amp; Roger Guimer\u00e0. <\/span><span data-contrast=\"none\">Nature Communications volume 14, Article number: 1043 (2023). DOI: <\/span><a href=\"https:\/\/doi.org\/10.1038\/s41467-023-36657-z\"><span data-contrast=\"none\">https:\/\/doi.org\/10.1038\/s41467-023-36657-z<\/span><\/a><span data-ccp-props=\"{&quot;201341983&quot;:0,&quot;335559739&quot;:160,&quot;335559740&quot;:259}\">\u00a0<\/span><\/p>\n","protected":false},"excerpt":{"rendered":"<p>Un estudio impulsado por el grupo de investigaci\u00f3n SeesLab de la URV demuestra por primera vez que los algoritmos de aprendizaje autom\u00e1tico no siempre logran encontrar modelos interpretables a partir de datos<\/p>\n","protected":false},"author":5,"featured_media":105852,"comment_status":"open","ping_status":"open","sticky":false,"template":"","format":"standard","meta":{"_acf_changed":false,"footnotes":""},"categories":[117,102,3467,245,4243,100,123],"tags":[1016],"class_list":["post-105812","post","type-post","status-publish","format-standard","has-post-thumbnail","hentry","category-ciencia-y-tecnologia","category-comunicacion-ciencia","category-ingenieria-quimica","category-escuela-ingenieria-quimica","category-grupos","category-investigacion","category-notas-prensa","tag-seeslab-es"],"acf":[],"_links":{"self":[{"href":"https:\/\/diaridigital.urv.cat\/es\/wp-json\/wp\/v2\/posts\/105812","targetHints":{"allow":["GET"]}}],"collection":[{"href":"https:\/\/diaridigital.urv.cat\/es\/wp-json\/wp\/v2\/posts"}],"about":[{"href":"https:\/\/diaridigital.urv.cat\/es\/wp-json\/wp\/v2\/types\/post"}],"author":[{"embeddable":true,"href":"https:\/\/diaridigital.urv.cat\/es\/wp-json\/wp\/v2\/users\/5"}],"replies":[{"embeddable":true,"href":"https:\/\/diaridigital.urv.cat\/es\/wp-json\/wp\/v2\/comments?post=105812"}],"version-history":[{"count":0,"href":"https:\/\/diaridigital.urv.cat\/es\/wp-json\/wp\/v2\/posts\/105812\/revisions"}],"wp:featuredmedia":[{"embeddable":true,"href":"https:\/\/diaridigital.urv.cat\/es\/wp-json\/wp\/v2\/media\/105852"}],"wp:attachment":[{"href":"https:\/\/diaridigital.urv.cat\/es\/wp-json\/wp\/v2\/media?parent=105812"}],"wp:term":[{"taxonomy":"category","embeddable":true,"href":"https:\/\/diaridigital.urv.cat\/es\/wp-json\/wp\/v2\/categories?post=105812"},{"taxonomy":"post_tag","embeddable":true,"href":"https:\/\/diaridigital.urv.cat\/es\/wp-json\/wp\/v2\/tags?post=105812"}],"curies":[{"name":"wp","href":"https:\/\/api.w.org\/{rel}","templated":true}]}}