Resumen: Los grandes modelos de razonamiento (LRM) destacan en tareas de razonamiento complejas mediante la generación de cadenas de pensamiento extendidas, pero su dependencia de largos pasos intermedios genera un costo computacional sustancial.
Leer más →
Resumen: Los agentes basados en modelos de lenguaje grande (LLM) exhiben sólidas capacidades de razonamiento paso a paso en horizontes cortos, pero a menudo no logran mantener un comportamiento coherente en horizontes de planificación largos.
Leer más →
Resumen: Los agentes que utilizan herramientas interactivas deben resolver tareas del mundo real a través de una interacción de múltiples turnos tanto con humanos como con entornos externos, lo que requiere seguimiento del estado del diálogo, ejecución de herramientas de múltiples pasos y al mismo tiempo seguir instrucciones complejas.
Leer más →