10/03/2026
La URV desenvolupa una nova eina per analitzar més de 250.000 estructures de proteïnes
Aquest nou programari facilita la classificació automàtica de les estructures del Protein Data Bank, una de les bases de dades de referència a escala internacional que fa possible el disseny computacional de fàrmacs
Aquest nou programari facilita la classificació automàtica de les estructures del Protein Data Bank, una de les bases de dades de referència a escala internacional que fa possible el disseny computacional de fàrmacs
Un equip del Grup de Recerca en Quimioinformàtica i Nutrició de la Universitat Rovira i Virgili (URV) ha desenvolupat PDB-CAT, una nova eina informàtica permet analitzar, classificar i extreure informació clau de les estructures tridimensionals de proteïnes dipositades al Protein Data Bank (PDB), una de les bases de dades de referència de la comunitat investigadora internacional en biologia estructural.
El PDB recull estructures tridimensionals de proteïnes, àcids nucleics i altres macromolècules biològiques obtingudes experimentalment. Aquestes estructures són fonamentals per entendre com funcionen les proteïnes, com reconeixen i interaccionen amb altres molècules i com es poden dissenyar fàrmacs capaços de modular-ne l’activitat.
Des de la seva creació, el volum de dades del Protein Data Bank ha crescut de manera ràpida i continuada. A dia d’avui ja compta amb prop de 250.000 estructures, i continua augmentat amb milers d’entrades noves cada any. Aquest allau d’informació, tot i ser un gran actiu per a la recerca, planteja dificultats pràctiques a l’hora de trobar i seleccionar de manera eficient quines estructures són realment útils per a una recerca concreta dins d’un volum de dades tan immens, especialment en projectes de disseny computacional de fàrmacs.
En molts casos, “una mateixa proteïna pot tenir desenes o centenars d’estructures disponibles al PDB. Aquestes poden diferir en si la proteïna està sola o unida a un lligand -una molècula-, en el tipus d’unió —covalent o no covalent— o en la presència de mutacions respecte a la seqüència considerada de referència, per exemple” explica Ariadna Llop Peiró, estudiant de doctorat del Departament de Bioquímica i Biotecnologia de la URV i l’encarregada principal del desenvolupament del programa. “Quan volem utilitzar aquestes estructures en projectes de disseny computacional de fàrmacs, cal analitzar quines existeixen, en què es diferencien i quines són adients per a l’objectiu del projecte. Fer-ho manualment és lent, propens a errors i poc viable quan el nombre d’estructures és tan elevat”, afegeix.
PDB-CAT s’ha dissenyat precisament per donar resposta a aquest repte. L’eina permet detectar de manera automàtica si una estructura conté un lligand unit a la proteïna, determinar si aquesta unió és covalent o no covalent —una informació clau en el desenvolupament de fàrmacs que sovint no està explícitament indicada als fitxers del PDB— i identificar possibles mutacions a la seqüència de la proteïna mitjançant la comparació amb una seqüència de referència proporcionada pels usuaris.

Menys temps d’anàlisi, més temps per a la recerca
Una de les principals fortaleses del programari és la seva eficiència. PDB-CAT està paral·lelitzat, i això fa que es pugui executar simultàniament en diversos processadors d’un mateix ordinador i reduir de manera significativa el temps d’anàlisi de grans conjunts d’estructures. Gràcies a aquesta optimització, “és possible analitzar tot el contingut actual del PDB en poques hores amb un ordinador de sobretaula equipat amb una CPU potent, i això que converteix aquesta nova eina en un recurs especialment útil per a projectes de disseny computacional de fàrmacs”, apunta Said Trujillo de León, estudiant del doble grau en Enginyeria Informàtica i en Biotecnologia, que ha estat l’encarregat de la implementació de la paral·lelització del programa.
Per comprovar el potencial de PDB-CAT, aquest nou programari s’ha aplicat a l’anàlisi de totes les estructures disponibles de la proteasa principal del SARS-CoV-2, un enzim essencial per a la replicació del virus i una de les principals dianes en la recerca de nous antivirals. Mitjançant aquesta eina, el grup de recerca ha pogut classificar sistemàticament les estructures, identificar quines contenen inhibidors, determinar si la unió és covalent o no covalent i detectar mutacions i variants de la proteïna, una informació clau per avançar en el disseny racional de nous compostos.
L’equip investigador també destaca que PDB-CAT és un programari lliure i de codi obert, disponible públicament a GitHub, i va acompanyat d’un tutorial detallat que en facilita l’ús tant a investigadors experts com a usuaris menys familiaritzats amb la programació.
Referència bibliogràfica: Llop-Peiró, A., Trujillo-De Leon, S., Pujadas, G., Garcia-Vallvé, S., & Gimeno, A. (2025). PDB-CAT: A user-friendly tool to classify and analyze PDB protein–ligand complexes. Protein Science, 34(12), e70379. https://doi.org/10.1002/pro.70379
