Resumen: La capacidad de diseñar variantes de proteínas optimizadas tiene un potencial transformador para la biotecnología y la medicina. Los métodos de optimización basados en secuencias anteriores luchan con las complejidades de alta dimensión debido al efecto epistasis y el desprecio por las restricciones estructurales. Para abordar esto, proponemos HADES, un método de optimización bayesiano que utiliza la dinámica hamiltoniana para tomar muestras de manera eficiente a partir de una estructura posterior aproximada consciente de la estructura. Aprovechando el impulso y la incertidumbre en los movimientos físicos simulados, HADES permite una rápida transición de propuestas hacia áreas prometedoras. Se introduce un procedimiento de discretización de posición para proponer secuencias de proteínas discretas a partir de dicho sistema de estado continuo. El sustituto posterior funciona con un marco codificador-decodificador de dos etapas para determinar la estructura y las relaciones funcionales entre los vecinos mutantes y, en consecuencia, aprende un paisaje suavizado del que tomar muestras. Amplios experimentos demuestran que nuestro método supera las líneas de base de última generación en evaluaciones in-silico en la mayoría de las métricas. Sorprendentemente, nuestro enfoque ofrece una ventaja única al aprovechar las limitaciones mutuas entre la estructura y la secuencia de las proteínas, facilitando el diseño de secuencias de proteínas con estructuras similares y propiedades optimizadas. El código y los datos están disponibles públicamente en esta URL https.
Publicado originalmente en export.arxiv.org el 18 de enero de 2026.
Ver fuente original
