04/05/2026

Desarrollan una inteligencia artificial que genera millones de moléculas nuevas

El sistema CoCoGraph permite crear compuestos químicos realistas que siguen las leyes de la química. Esta investigación de la Universitat Rovira i Virgili (URV) abre nuevas vías para el descubrimiento de fármacos y materiales

La búsqueda de nuevas moléculas es uno de los grandes retos de la química moderna. Desde el desarrollo de fármacos hasta la creación de materiales más sostenibles, todo se enfoca en encontrar combinaciones de átomos con propiedades útiles. Un equipo investigador de la Universitat Rovira i Virgili (URV) ha desarrollado una herramienta de inteligencia artificial capaz de generar millones de moléculas nuevas que, aunque no se conocen todavía, cumplen las leyes de la química y, por tanto, podrían ser reales. Los resultados de la investigación se han publicado en la revista Nature Machine Intelligence.

El sistema, llamado CoCoGraph, funciona de manera similar a las herramientas de inteligencia artificial generativa de texto o de imágenes, como ChatGPT o DALL·E. “Estos modelos crean contenido nuevo que se parece mucho al real. Nuestro algoritmo hace lo mismo, pero con moléculas”, explica Roger Guimerà, profesor de investigación ICREA del Departamento de Ingeniería Química de la URV.

A diferencia de otras aplicaciones de IA, sin embargo, el modelo todavía no responde a instrucciones concretas. Por ahora, tiene un objetivo más básico: generar moléculas plausibles, es decir, estructuras que cumplan las reglas de la química.

Ahora bien, el reto es enorme. Si se da al sistema una misma fórmula molecular —por ejemplo, la del paracetamol— se puede construir una cantidad ingente de combinaciones de átomos. Sin embargo, solo una pequeña fracción de estas combinaciones es viable en la realidad.

“El espacio de moléculas posibles es inmenso. Se estima que podría haber hasta 10⁶⁰ moléculas diferentes, que son muchas más que moléculas de agua en el océano”, explica Guimerà. Sin embargo, las moléculas conocidas solo representan una parte ínfima. Esto hace que encontrar nuevas moléculas útiles sea como buscar una aguja en un pajar gigantesco.

Roger Guimerà, Manuel XXX i Marta Sales, investigadors del Departament d'Enginyeria Química de la URV, han participat a la recerca.
Roger Guimerà, Manuel Ruiz-Botella y Marta Sales-Pardo, investigadores del Departamento de Ingeniería Química de la URV, han participado en la investigación.

Cómo funciona el modelo

Para generar estas nuevas moléculas, CoCoGraph utiliza una técnica llamada modelo de difusión, habitual en la generación de imágenes. El proceso consiste en “desordenar” progresivamente una molécula real y entrenar el sistema para que aprenda a reconstruirla.

“Partimos de una molécula real, rompemos los enlaces y creamos otros nuevos de manera aleatoria. El modelo aprende a revertir este proceso y a reconstruir estructuras coherentes”, comenta Marta Sales-Pardo, investigadora del Departamento de Ingeniería Química que también ha participado en la investigación.

A diferencia de las imágenes, las moléculas son estructuras discretas (grafos), lo que hace el problema mucho más complejo desde el punto de vista matemático.

Moléculas siempre válidas

Una de las principales innovaciones del modelo es que incorpora directamente las reglas básicas de la química. Por ejemplo, cada átomo mantiene siempre el número correcto de enlaces, y esto garantiza que el 100% de las moléculas generadas sean químicamente válidas, a diferencia de otros modelos que pueden producir estructuras imposibles.

Además, el sistema es más eficiente: utiliza menos parámetros, necesita menos potencia de cálculo y puede generar moléculas más rápidamente.

El equipo investigador ha comparado CoCoGraph con otros modelos de última generación y ha analizado hasta 36 propiedades fisicoquímicas de las moléculas generadas, como la solubilidad o la complejidad estructural. El resultado es que las moléculas generadas son químicamente más realistas que en otros modelos en aproximadamente dos terceras partes de estas propiedades.

Comprobación entre la comunidad científica

Para comprobar hasta qué punto estas moléculas son plausibles, el equipo realizó un experimento con 121 expertos en química de la misma universidad. A cada participante se le mostraban veinte pares de moléculas —una real y otra generada por la nueva IA— y debía identificar cuál era la real.

Los resultados mostraron que los expertos se equivocan en aproximadamente 4 de cada 10 casos, es decir, a menudo confunden las moléculas generadas con las reales. “Esto significa que muchas de las moléculas que generamos son muy convincentes”, explica Sales.

Aunque el modelo todavía no permite diseñar moléculas con una función concreta, ya se han hecho pruebas prometedoras. Por ejemplo, se han identificado moléculas con propiedades similares al paracetamol dentro de los millones de moléculas generadas. También han explorado técnicas para modificar parcialmente una molécula existente —una especie de “retoque” químico— para crear nuevas variantes con características parecidas.

Estas aproximaciones podrían ser útiles en el futuro para optimizar fármacos o desarrollar nuevos materiales.

El primer paso hacia una IA que diseñe moléculas a medida

El equipo investigador tiene claro que esto es solo el comienzo. El objetivo principal a medio o largo plazo es poder pedir a la inteligencia artificial una molécula con propiedades específicas, que sea soluble, no tóxica y útil para una aplicación concreta.

“De momento solo generamos moléculas. El siguiente paso será poder guiar esta generación con objetivos concretos”, dice Manuel Ruiz-Botella, estudiante de doctorado que también ha participado en la investigación.

Si se consigue, esta tecnología podría transformar campos como la química, la farmacología o la ciencia de materiales y acelerar el descubrimiento de nuevas soluciones en un espacio químico prácticamente inexplorado.

Referència bibliogràfica: Ruiz-Botella, M., Sales-Pardo, M. & Guimerà, R. A collaborative constrained graph diffusion model for the generation of realistic synthetic molecules. Nat Mach Intell (2026). https://doi.org/10.1038/s42256-026-01229-5

Print Friendly, PDF & Email
Suscríbete a los boletines de la URV

Comenta

*