10/03/2026

La URV desarrolla una nueva herramienta para analizar más de 250.000 estructuras de proteínas

Este nuevo software facilita la clasificación automática de las estructuras del Protein Data Bank, una de las bases de datos de referencia internacional que hace posible el diseño computacional de fármacos

Foto: Pixabay.

Un equipo del Grupo de Investigación en Quimioinformática y Nutrición de la Universitat Rovira i Virgili (URV) ha desarrollado PDB-CAT, una nueva herramienta informática que permite analizar, clasificar y extraer información clave de las estructuras tridimensionales de proteínas depositadas en el Protein Data Bank (PDB), una de las bases de datos de referencia de la comunidad investigadora internacional en biología estructural.

El PDB recopila estructuras tridimensionales de proteínas, ácidos nucleicos y otras macromoléculas biológicas obtenidas experimentalmente. Estas estructuras son fundamentales para entender cómo funcionan las proteínas, cómo reconocen e interactúan con otras moléculas y cómo se pueden diseñar fármacos capaces de modular su actividad.

Desde su creación, el volumen de datos del Protein Data Bank ha crecido de manera rápida y continuada. A día de hoy ya cuenta con cerca de 250.000 estructuras, y sigue aumentando con miles entradas nuevas cada año. Esta avalancha de información, aunque constituye un gran activo para la investigación, plantea dificultades prácticas a la hora de encontrar y seleccionar de manera eficiente qué estructuras son realmente útiles para una investigación concreta dentro de un volumen de datos tan inmenso, especialmente en proyectos de diseño computacional de fármacos.

En muchos casos, “una misma proteína puede tener decenas o centenares de estructuras disponibles en el PDB. Estas pueden diferir en si la proteína está sola o unida a un ligando —una molécula—, en el tipo de unión —covalente o no covalente— o en la presencia de mutaciones respecto a la secuencia considerada de referencia, por ejemplo”, explica Ariadna Llop Peiró, estudiante de doctorado del Departamento de Bioquímica y Biotecnología de la URV y principal responsable del desarrollo del programa. “Cuando queremos utilizar estas estructuras en proyectos de diseño computacional de fármacos hay que analizar cuáles existen, en qué se diferencian y cuáles son adecuadas para el objetivo del proyecto. Hacerlo manualmente es lento, propenso a errores y poco viable cuando el número de estructuras es tan elevado”, añade.

PDB-CAT se ha diseñado precisamente para dar respuesta a este reto. La herramienta permite detectar de manera automática si una estructura contiene un ligando unido a la proteína, determinar si esta unión es covalente o no covalente —una información clave en el desarrollo de fármacos que a menudo no está explícitamente indicada en los archivos del PDB— e identificar posibles mutaciones en la secuencia de la proteína mediante la comparación con una secuencia de referencia proporcionada por los usuarios.

Santiago Garcia Vallvé i Aleix Gimeno, investigadors del Departament de Bioquímica i Biotecnologia que han participat en la recerca.
Santiago Garcia Vallvé y Aleix Gimeno, investigadores del Departamento de Bioquímica y Biotecnología que han participado en el estudio.
Menos tiempo de análisis, más tiempo para la investigación

Una de las principales fortalezas del software es su eficiencia. PDB-CAT está paralelizado, lo que permite ejecutarlo simultáneamente en varios procesadores de un mismo ordenador y reducir de manera significativa el tiempo de análisis de grandes conjuntos de estructuras. Gracias a esta optimización, “es posible analizar todo el contenido actual del PDB en pocas horas con un ordenador de sobremesa equipado con una CPU potente, lo que convierte esta nueva herramienta en un recurso especialmente útil para proyectos de diseño computacional de fármacos”, señala Said Trujillo de León, estudiante del doble grado en Ingeniería Informática y en Biotecnología, que ha sido el responsable de la implementación de la paralelización del programa.

Para comprobar el potencial de PDB-CAT, este nuevo software se ha aplicado al análisis de todas las estructuras disponibles de la proteasa principal del SARS-CoV-2, una enzima esencial para la replicación del virus y una de las principales dianas en la investigación de nuevos antivirales. Mediante esta herramienta, el grupo de investigación ha podido clasificar sistemáticamente las estructuras, identificar cuáles contienen inhibidores, determinar si la unión es covalente o no covalente y detectar mutaciones y variantes de la proteína, una información clave para avanzar en el diseño racional de nuevos compuestos.

El equipo investigador también destaca que PDB-CAT es un software libre y de código abierto, disponible públicamente en GitHub, y va acompañado de un tutorial detallado que facilita su uso tanto a investigadores expertos como a usuarios menos familiarizados con la programación.

Referencia bibliográfica: Llop-Peiró, A., Trujillo-De Leon, S., Pujadas, G., Garcia-Vallvé, S., & Gimeno, A. (2025). PDB-CAT: A user-friendly tool to classify and analyze PDB protein–ligand complexes. Protein Science, 34(12), e70379. https://doi.org/10.1002/pro.70379

Print Friendly, PDF & Email
Suscríbete a los boletines de la URV

Comenta

*