Resumen: Los avances recientes en modelos de lenguajes grandes (LLM) han puesto de relieve la eficacia del razonamiento en cadena de pensamiento en dominios simbólicos como las matemáticas y la programación. Sin embargo, nuestro estudio muestra que transferir directamente dichos paradigmas de razonamiento basados en texto a la comprensión de la función de las proteínas es ineficaz: el aprendizaje por refuerzo amplifica principalmente los patrones superficiales de palabras clave y no introduce nuevos conocimientos biológicos, lo que da como resultado una generalización limitada. Sostenemos que la predicción de la función de las proteínas es una tarea científica que requiere mucho conocimiento y que se basa fundamentalmente en antecedentes biológicos externos y herramientas computacionales en lugar de un razonamiento puramente interno. Para abordar esta brecha, proponemos PFUA, un agente de razonamiento proteico aumentado con herramientas que unifica la descomposición de problemas, la invocación de herramientas y la generación de respuestas fundamentadas. En lugar de depender de largas trazas de razonamiento sin restricciones, PFUA integra herramientas de dominio específico para producir evidencia intermedia verificable. Los experimentos en cuatro puntos de referencia demuestran que PFUA supera consistentemente a los modelos de razonamiento de solo texto con una mejora promedio del rendimiento del 103 %.
Publicado originalmente en export.arxiv.org el 7 de enero de 2026.
Ver fuente original
