VirtuDockDL: una plataforma impulsada por el aprendizaje profundo para el descubrimiento acelerado de fármacos mediante la detección avanzada de compuestos y la predicción de unión

El descubrimiento de fármacos es un proceso largo y costoso con altas tasas de fracaso, ya que normalmente solo surge un fármaco viable de un millón de compuestos analizados. Las tecnologías avanzadas de detección de alto rendimiento (HTS) y ultra alto rendimiento (uHTS) permiten realizar pruebas rápidas de grandes bibliotecas de compuestos, lo que permite a las empresas farmacéuticas y biotecnológicas explorar más compuestos químicos y nuevos objetivos biológicos. A pesar de estas tecnologías, aún es necesario abordar desafíos, incluidos avances limitados en la identificación de nuevos objetivos farmacológicos y problemas de calidad de los datos. ML y DL ahora ofrecen soluciones prometedoras, mejorando el descubrimiento de fármacos a través de conocimientos basados ​​en datos, extracción de características y capacidades predictivas para identificar candidatos a fármacos eficaces de manera más eficiente.

VirtuDockDL, desarrollado por investigadores del Instituto de Biología Molecular y Biotecnología de la Universidad de Lahore, el Laboratorio de Modelado Molecular y Ómica Integrativa de la Universidad Government College de Faisalabad (GCUF), la Universidad de Shenzhen y la Universidad de Taif, es una plataforma basada en Python que aprovecha el aprendizaje profundo. para agilizar el descubrimiento de fármacos. Utilizando una red neuronal gráfica (GNN) para predecir la efectividad de los compuestos, VirtuDockDL logró una precisión del 99 % en el conjunto de datos de HER2, superando a herramientas como DeepChem y AutoDock Vina. El marco automatizado de esta plataforma integra la construcción de gráficos moleculares, la detección virtual y la agrupación de compuestos, lo que permite la identificación eficiente de medicamentos potenciales y el avance de la investigación farmacéutica impulsada por la IA.

VirtuDockDL es un proyecto integral diseñado para agilizar la predicción y la detección de compuestos biológicamente activos utilizando un GNN. Inicialmente codificados como cadenas SMILES, los datos moleculares se transforman en representaciones gráficas a través de RDKit y se procesan mediante la arquitectura GNN de PyTorch Geométrica. Esta transformación permite a la GNN aprender relaciones estructurales complejas dentro de las moléculas y predecir propiedades como la actividad molecular o la afinidad de unión. La arquitectura incorpora varias capas de convolución de gráficos para capturar características moleculares en diferentes niveles jerárquicos, junto con normalización por lotes, abandono y conexiones residuales, que estabilizan el entrenamiento y mejoran la precisión predictiva. Este proceso combina representaciones basadas en gráficos con descriptores quimioinformáticos y huellas dactilares, lo que proporciona un conjunto de funciones sólidas para una predicción precisa de la actividad.

La aplicación también incluye herramientas virtuales de detección y agrupación, que permiten a los usuarios evaluar grandes bibliotecas de compuestos frente a objetivos proteicos específicos. En función de su actividad prevista, la agrupación de moléculas seleccionadas se logra mediante modelos de mezcla gaussiana (GMM), y la calidad de la agrupación se evalúa mediante puntuaciones de Silhouette y Davies-Bouldin. La tubería admite el refinamiento de la estructura de proteínas a través de OpenMM y el acoplamiento de ligandos con AutoDock Vina, lo que permite predicciones de afinidad de unión molecular. VirtuDockDL se aplicó a la investigación del virus de Marburg, utilizando la proteína VP35 como caso de estudio. Se generaron conjuntos de datos positivos y señuelo, y el modelo GNN clasificó con precisión los compuestos con pérdida de entropía cruzada y optimización RMSprop. Los resultados de detección y acoplamiento virtuales, incluidas métricas clave como AUC, precisión y puntuación F1, se visualizan automáticamente, lo que proporciona información procesable sobre posibles inhibidores de VP35 para el descubrimiento de fármacos.

La GUI fácil de usar de VirtuDockDL, basada en el marco Flask, admite cargas de moléculas, inicio de tareas y descargas de resultados, organizando funciones en pestañas para facilitar su uso. Se entrenó un modelo GNN utilizando moléculas de proteína VP35 activas/inactivas, logrando una alta precisión (97,79%) con métricas sólidas (AUC 0,9972). Se volvieron a seleccionar inhibidores no covalentes de las bases de datos ZINC y PubChem, identificando 146 candidatos potenciales. Pruebas adicionales en conjuntos de datos de HER2, beta-lactamasa y CYP51 demostraron el rendimiento superior de VirtuDockDL en las predicciones de afinidad de unión en comparación con PyRMD, RosettaVS, MzDOCK, AutoDock Vina y Glide. La integración de VirtuDockDL de detección basada en ligandos y estructuras proporciona una detección virtual eficiente y precisa.

En conclusión, VirtuDockDL es una nueva plataforma web basada en Python diseñada para optimizar el descubrimiento de fármacos mediante el aprendizaje profundo. Al emplear una red neuronal Graph para la detección de compuestos, ha demostrado una precisión predictiva excepcional y una utilidad práctica en múltiples objetivos, incluidos inhibidores de HER2 (cáncer), beta-lactamasa TEM-1 (infecciones bacterianas) y CYP51 (candidiasis). Logró resultados superiores en la evaluación comparativa, superando a herramientas como DeepChem y AutoDock Vina con una precisión del 99 % y una puntuación F1 de 0,992 en el conjunto de datos HER2. Esta plataforma combina automatización total y un diseño fácil de usar, lo que la convierte en una herramienta eficiente y rentable para avanzar en la investigación farmacéutica y abordar desafíos de salud urgentes.


Mira el Papel. Todo el crédito por esta investigación va a los investigadores de este proyecto. Además, no olvides seguirnos en Gorjeo y únete a nuestro Canal de telegramas y LinkedIn Grarriba. Si te gusta nuestro trabajo, te encantará nuestro hoja informativa.. No olvides unirte a nuestro SubReddit de más de 55.000 ml.

(SEMINARIO WEB GRATUITO sobre IA) Implementación del procesamiento inteligente de documentos con GenAI en servicios financieros y transacciones inmobiliariasDel marco a la producción


A Sana Hassan, pasante de consultoría en Marktechpost y estudiante de doble titulación en IIT Madras, le apasiona aplicar la tecnología y la inteligencia artificial para abordar los desafíos del mundo real. Con un gran interés en resolver problemas prácticos, aporta una nueva perspectiva a la intersección de la IA y las soluciones de la vida real.

🐝🐝 Evento de LinkedIn, ‘Una plataforma, posibilidades multimodales’, donde el director ejecutivo de Encord, Eric Landau, y el director de ingeniería de productos, Justin Sharps, hablarán sobre cómo están reinventando el proceso de desarrollo de datos para ayudar a los equipos a construir rápidamente modelos de IA multimodales innovadores.

Leer más
Back to top button