AI2BMD: un enfoque de aprendizaje automático con precisión cuántica para dinámica biomolecular a gran escala
Las simulaciones de dinámica biomolecular son cruciales para las ciencias biológicas y ofrecen información sobre las interacciones moleculares. Si bien las simulaciones de dinámica molecular (MD) clásica son eficientes, carecen de precisión química. Métodos como la teoría funcional de la densidad (DFT) logran una alta precisión, pero son demasiado intensos desde el punto de vista computacional para biomoléculas grandes. Las simulaciones de MD permiten la observación del comportamiento molecular: la MD clásica utiliza potenciales interatómicos y la MD ab initio (AIMD) deriva fuerzas de estructuras electrónicas. Los problemas de escalabilidad de AIMD limitan su uso en estudios biomoleculares. Los campos de fuerza de aprendizaje automático (MLFF), entrenados con datos de nivel DFT, prometen precisión a costos más bajos, aunque la generalización entre diversas conformaciones moleculares sigue siendo un desafío.
Investigadores de Microsoft Research en Beijing presentaron AI2BMD, un sistema basado en inteligencia artificial para simular biomoléculas grandes con precisión ab initio. AI2BMD utiliza una técnica de fragmentación de proteínas y un campo de fuerza de aprendizaje automático, lo que le permite calcular con precisión la energía y las fuerzas de proteínas con más de 10.000 átomos. Este sistema es mucho más eficiente que el DFT tradicional y reduce los tiempos de simulación en órdenes de magnitud. AI2BMD puede realizar cientos de nanosegundos de simulaciones, capturando el plegamiento, el despliegue y la dinámica conformacional de proteínas. Sus predicciones termodinámicas se alinean estrechamente con los datos experimentales, lo que la convierte en una herramienta valiosa para complementar los experimentos de laboratorio húmedo y promover la investigación biomédica.
El enfoque de fragmentación de proteínas se basa en la estructura fundamental de los aminoácidos en las proteínas, donde cada aminoácido contiene una cadena principal de átomos (Cα, C, O, N y H) y una cadena lateral distinta. Para crear un modelo que se aplique ampliamente a varias proteínas, cada aminoácido se trata como un dipéptido, cubierto con grupos Ace y Nme en sus extremos. Este enfoque, basado en fragmentos superpuestos de dipéptidos, ayuda a garantizar una cobertura proteica integral. Usando una ventana deslizante, las cadenas de proteínas se dividen en estos dipéptidos, donde cada fragmento incluye átomos de la cadena principal y átomos parciales de aminoácidos adyacentes. Este método calcula con precisión las energías de las proteínas y las fuerzas atómicas agregando hidrógenos según sea necesario para los enlaces Cα y optimizando las posiciones utilizando un algoritmo cuasi-Newton. Este método generalizable permite la aplicación sistemática a todas las proteínas, reduciendo las complejidades y maximizando la precisión del modelo.
El conjunto de datos de entrenamiento para el potencial AI2BMD implica tomar muestras de millones de conformaciones de dipéptidos para capturar la variedad de estructuras de proteínas. Se entrenó un modelo de aprendizaje profundo llamado ViSNet utilizando este extenso conjunto de datos para predecir la energía y las fuerzas atómicas basándose en números atómicos y coordenadas. El modelo utilizó hiperparámetros específicos para optimizar la precisión y fue entrenado con técnicas de parada temprana. Las simulaciones basadas en el potencial AI2BMD se procesan mediante un programa de simulación impulsado por IA compatible con la nube, lo que permite una implementación flexible en todos los entornos informáticos. Este sistema admite procesos de simulación paralelizados y preserva automáticamente el progreso en el almacenamiento en la nube, lo que garantiza un manejo sólido y eficiente del modelado de la dinámica de las proteínas.
AI2BMD muestra un potencial significativo en la estimación de propiedades de proteínas, especialmente para el análisis termodinámico de proteínas de plegamiento rápido. AI2BMD podría clasificar estructuras en estados plegados y desplegados simulando varios tipos de proteínas y prediciendo con precisión valores de energía potencial. Sus estimaciones de la temperatura de fusión (Tm) para proteínas como el dominio WW y NTL9 coincidieron estrechamente con los datos experimentales, superando con frecuencia a los métodos tradicionales de mecánica molecular (MM). Además, los cálculos de AI2BMD para la energía libre (ΔG), la entalpía y la capacidad calorífica fueron muy consistentes con los hallazgos experimentales, lo que reforzó su precisión. Esta solidez en la estimación termodinámica resalta el valor de AI2BMD como herramienta avanzada para el análisis de proteínas.
Además de en termodinámica, AI2BMD demostró ser eficaz en cálculos alquímicos de energía libre, como la predicción de pKa, y es valioso en la investigación bioquímica. A diferencia de los métodos tradicionales QM-MM que restringen los cálculos a regiones preestablecidas, el enfoque ab initio de AI2BMD permite el modelado de proteínas completas sin inconsistencias en los límites, lo que lo hace versátil para proteínas complejas y estados dinámicos. Aunque la velocidad de AI2BMD es aún más lenta que la de la MD clásica, futuras optimizaciones y aplicaciones a otros sistemas biomoleculares podrían mejorar su eficiencia. La adaptabilidad de AI2BMD la convierte en una herramienta prometedora para el descubrimiento de fármacos, el diseño de proteínas y la ingeniería enzimática, y ofrece simulaciones de alta precisión para diversas aplicaciones biomoleculares.
Mira el Papel y Detalles. Todo el crédito por esta investigación va a los investigadores de este proyecto. Además, no olvides seguirnos en Gorjeo y únete a nuestro Canal de telegramas y LinkedIn Grarriba. Si te gusta nuestro trabajo, te encantará nuestro hoja informativa.. No olvides unirte a nuestro SubReddit de más de 55.000 ml.
(Oportunidad de Patrocinio con nosotros) Promocione su investigación/producto/seminario web con más de 1 millón de lectores mensuales y más de 500.000 miembros de la comunidad
A Sana Hassan, pasante de consultoría en Marktechpost y estudiante de doble titulación en IIT Madras, le apasiona aplicar la tecnología y la inteligencia artificial para abordar los desafíos del mundo real. Con un gran interés en resolver problemas prácticos, aporta una nueva perspectiva a la intersección de la IA y las soluciones de la vida real.
Escuche nuestros últimos podcasts de IA y vídeos de investigación de IA aquí ➡️