En este momento estás viendo 
<span class="bsf-rt-reading-time"><span class="bsf-rt-display-label" prefix="Tiempo de lectura"></span> <span class="bsf-rt-display-time" reading_time="1"></span> <span class="bsf-rt-display-postfix" postfix="mins"></span></span><!-- .bsf-rt-reading-time -->Agentes de razonamiento en tiempo real en entornos en evolución

Agentes de razonamiento en tiempo real en entornos en evolución

  • Autor de la entrada:
  • Categoría de la entrada:Noticias externas

Resumen: Los agentes en el mundo real deben emitir juicios no sólo lógicos sino también oportunos. Esto requiere una conciencia continua del entorno dinámico: surgen peligros, surgen oportunidades y otros agentes actúan, mientras el razonamiento del agente aún se está desarrollando. A pesar de los avances en el razonamiento de los modelos lingüísticos, los enfoques existentes no tienen en cuenta esta naturaleza dinámica. Introducimos el razonamiento en tiempo real como una nueva formulación de problemas para agentes en entornos en evolución y construimos Real-Time Reasoning Gym para demostrarlo. Estudiamos dos paradigmas para implementar modelos de lenguaje en agentes: (1) agentes reactivos, que emplean modelos de lenguaje con cálculo de razonamiento acotado para respuestas rápidas, y (2) agentes de planificación, que permiten cálculo de razonamiento extendido para problemas complejos. Nuestros experimentos muestran que incluso los modelos más modernos tienen dificultades para emitir juicios lógicos y oportunos en cualquiera de los dos paradigmas. Para abordar esta limitación, proponemos AgileThinker, que involucra simultáneamente ambos paradigmas de razonamiento. AgileThinker supera consistentemente a los agentes que utilizan un solo paradigma de razonamiento a medida que aumentan la dificultad de la tarea y la presión del tiempo, equilibrando efectivamente la profundidad del razonamiento y la latencia de la respuesta. Nuestro trabajo establece el razonamiento en tiempo real como un banco de pruebas crítico para el desarrollo de agentes prácticos y proporciona una base para la investigación en sistemas de IA temporalmente limitados, destacando un camino hacia agentes con capacidad en tiempo real.

Publicado originalmente en export.arxiv.org el 9 de noviembre de 2025.
Ver fuente original

admin

Usuario de administración del sitio web