En este momento estás viendo 
<span class="bsf-rt-reading-time"><span class="bsf-rt-display-label" prefix="Tiempo de lectura"></span> <span class="bsf-rt-display-time" reading_time="2"></span> <span class="bsf-rt-display-postfix" postfix="mins"></span></span><!-- .bsf-rt-reading-time -->Más allá de lo rápido y lo lento: razonamiento elástico de inspiración cognitiva para modelos de lenguaje grandes

Más allá de lo rápido y lo lento: razonamiento elástico de inspiración cognitiva para modelos de lenguaje grandes

  • Autor de la entrada:
  • Categoría de la entrada:Noticias externas

Resumen: Los modelos de lenguajes grandes (LLM) han demostrado un rendimiento impresionante en diversas tareas lingüísticas. Sin embargo, las estrategias de razonamiento LLM existentes se basan principalmente en el propio LLM con modo rápido o lento (como el pensamiento o1) y, por lo tanto, tienen dificultades para equilibrar la eficiencia y la precisión del razonamiento en consultas de diversas dificultades. En este artículo, proponemos el Razonamiento Elástico de Inspiración Cognitiva (CogER), un marco inspirado en el razonamiento jerárquico humano que selecciona dinámicamente la estrategia de razonamiento más adecuada para cada consulta. Específicamente, CogER primero evalúa la complejidad de las consultas entrantes y las asigna a uno de varios niveles predefinidos, cada uno de los cuales corresponde a una estrategia de procesamiento personalizada, abordando así el desafío de la dificultad de las consultas no observables. Para lograr la selección automática de estrategias, modelamos el proceso como un proceso de decisión de Markov y entrenamos a un agente CogER mediante aprendizaje por refuerzo. El agente es guiado por una función de recompensa que equilibra la calidad de la solución y el costo computacional, asegurando un razonamiento eficiente en el uso de recursos. Además, para consultas que requieren herramientas externas, presentamos el razonamiento cognitivo asistido por herramientas, que permite al LLM invocar de forma autónoma herramientas externas dentro de su cadena de pensamiento. Amplios experimentos demuestran que CogER supera los métodos de escalamiento de tiempo de prueba de última generación, logrando al menos una mejora relativa del 13 % en la coincidencia exacta promedio en tareas dentro del dominio y una ganancia relativa del 8 % en tareas fuera del dominio.

Publicado originalmente en export.arxiv.org el 18 de diciembre de 2025.
Ver fuente original

admin

Usuario de administración del sitio web