04/05/2026

Desenvolupen una intel·ligència artificial que genera milions de molècules noves

El sistema CoCoGraph permet crear compostos químics realistes seguint les lleis de la química. Aquesta recerca de la URV obre noves vies per a descobrir fàrmacs i materials

La recerca de noves molècules és un dels grans reptes de la química moderna. Des del desenvolupament de fàrmacs fins a la creació de materials més sostenibles, tot s’enfoca cap atrobar combinacions d’àtoms amb propietats útils. Un equip investigador de la Universitat Rovira i Virgili (URV) ha desenvolupat una eina d’intel·ligència artificial capaç de generar milions de molècules noves que, tot i que no ser conegudes encara, compleixen les lleis de la química i, per tant, podrien ser reals. Els resultats de la recerca s’han publicat a la revista Nature Machine Intelligence.

El sistema, anomenat CoCoGraph, funciona de manera similar a les eines d’intel·ligència artificial generativa de text o d’imatges, com ChatGPT o DALL·E. “Aquests models creen contingut nou que s’assembla molt al real. El nostre algoritme fa el mateix, però amb molècules”, explica Roger Guimerà, professor de recerca ICREA del Departament d’Enginyeria Química de la URV.

A diferència d’altres aplicacions d’IA, però, el model no respon encara a instruccions concretes. De moment, té un objectiu és més bàsic: generar molècules plausibles, és a dir, estructures que compleixin les regles de la química.

Ara bé, el repte és enorme. Si es dona al sistema una mateixa fórmula molecular —per exemple, la del paracetamol— es pot construir una quantitat ingent de combinacions d’àtoms. En canvi, només una petita fracció d’aquestes combinacions és viable en la realitat.

“L’espai de molècules possibles és immens. S’estima que podria haver-hi fins a 10⁶⁰ molècules diferents, que són moltes més que molècules d’aigua a l’oceà”, explica Guimerà”. Per contra, les molècules conegudes només en representen una part ínfima. Això fa que trobar noves molècules útils sigui com buscar una agulla en un paller gegantí.

Roger Guimerà, Manuel XXX i Marta Sales, investigadors del Departament d'Enginyeria Química de la URV, han participat a la recerca.
Roger Guimerà, Manuel Ruiz-Botella i Marta Sales, investigadors del Departament d’Enginyeria Química de la URV, han participat a la recerca.
Com funciona el model

Per generar aquestes noves molècules, CoCoGraph utilitza una tècnica anomenada model de difusió, habitual en la generació d’imatges. El procés consisteix a “desordenar” progressivament una molècula real i entrenar el sistema perquè aprengui a reconstruir-la.

“Partim d’una molècula real, trenquem els enllaços i en creem de nous de manera aleatòria. El model aprèn a revertir aquest procés i reconstruir estructures coherents”, comenta Marta Sales-Pardo, investigadora del Departament d’Enginyeria Química que també ha participat en la recerca.

A diferència de les imatgesles molècules són estructures discretes (grafs), cosa que fa el problema molt més complex des del punt de vista matemàtic.

Molècules sempre vàlides

Una de les principals innovacions del model és que incorpora directament les regles bàsiques de la química. Per exemple, cada àtom manté sempre el nombre correcte d’enllaços i això garanteix que el 100% de les molècules generades siguin químicament vàlides, a diferència d’altres models que poden produir estructures impossibles.

A més, el sistema és més eficient: utilitza menys paràmetres, necessita menys potència de càlcul i pot generar molècules més ràpidament.

L’equip investigador ha comparat CoCoGraph amb altres models d’última generació i han analitzat fins a 36 propietats fisicoquímiques de les molècules generades, com la solubilitat o la complexitat estructural. El resultat és que les molècules generades són químicament més realistes que en altres models en aproximadament dues terceres parts d’aquestes propietats.

Comprovació entre la comunitat científica

Per comprovar fins a quin punt aquestes molècules són plausibles, l’equip va fer un experiment amb 121 experts en química de la mateixa Universitat. A cada participant se li mostraven vint parelles de molècules —una de real i una de generada per la nova IA— i havia d’identificar quina era la real.

Els resultats van mostrar que els experts s’equivoquen en aproximadament 4 de cada 10 casos, és a dir, sovint confonen les molècules generades amb les reals. “Això vol dir que moltes de les molècules que generem són molt convincents”, explica Sales.

Tot i que el model encara no permet dissenyar molècules amb una funció concreta, ja se n’han fet proves prometedores. Per exemple, s’han identificat molècules amb propietats similars al paracetamol dins dels milions de molècules generades. També han explorat tècniques per modificar parcialment una molècula existent —una mena de “retoc” químic— per crear noves variants amb característiques semblants.

Aquestes aproximacions podrien ser útils en el futur per optimitzar fàrmacs o desenvolupar materials nous.

El primer pas cap a una IA que dissenyi molècules a mida

L’equip investigador té clar que això és només el començament. L’objectiu principal a mitjà o a llarg termini és poder demanar a la intel·ligència artificial una molècula amb propietats específiques que sigui soluble, no tòxica i que resulti útil per a una aplicació específica.

“De moment només generem molècules. El pas següent serà poder guiar aquesta generació amb objectius concrets”, diu Manuel Ruiz-Botella, estudiant de doctorat que també ha participat en la recerca.

Si s’aconsegueix, aquesta tecnologia podria transformar camps com la química, la farmacologia o la ciència de materials i accelerar el descobriment de noves solucions en un espai químic pràcticament inexplorat.

Referència bibliogràfica: Ruiz-Botella, M., Sales-Pardo, M. & Guimerà, R. A collaborative constrained graph diffusion model for the generation of realistic synthetic molecules. Nat Mach Intell (2026). https://doi.org/10.1038/s42256-026-01229-5

Print Friendly, PDF & Email
Subscriu-te als butlletins de la URV

Comenta

*