Más allá de lo rápido y lo lento: razonamiento elástico de inspiración cognitiva para modelos de lenguaje grandes

Resumen: Los modelos de lenguajes grandes (LLM) han demostrado un rendimiento impresionante en diversas tareas lingüísticas. Sin embargo, las estrategias de razonamiento LLM existentes se basan principalmente en el propio LLM con modo rápido o lento (como el pensamiento o1) y, por lo tanto, tienen dificultades para equilibrar la eficiencia y la precisión del razonamiento en consultas de diversas dificultades. En este artículo, proponemos el Razonamiento Elástico de Inspiración Cognitiva (CogER), un marco inspirado en el razonamiento jerárquico humano que selecciona dinámicamente la estrategia de razonamiento más adecuada para cada consulta. Específicamente, CogER primero evalúa la complejidad de las consultas entrantes y las asigna a uno de varios niveles predefinidos, cada uno de los cuales corresponde a una estrategia de procesamiento personalizada, abordando así el desafío de la dificultad de las consultas no observables. Para lograr la selección automática de estrategias, modelamos el proceso como un proceso de decisión de Markov y entrenamos a un agente CogER mediante aprendizaje por refuerzo. El agente es guiado por una función de recompensa que equilibra la calidad de la solución y el costo computacional, asegurando un razonamiento eficiente en el uso de recursos. Además, para consultas que requieren herramientas externas, presentamos el razonamiento cognitivo asistido por herramientas, que permite al LLM invocar de forma autónoma herramientas externas dentro de su cadena de pensamiento. Amplios experimentos demuestran que CogER supera los métodos de escalamiento de tiempo de prueba de última generación, logrando al menos una mejora relativa del 13 % en la coincidencia exacta promedio en tareas dentro del dominio y una ganancia relativa del 8 % en tareas fuera del dominio.

Publicado originalmente en export.arxiv.org el 18 de diciembre de 2025.
Ver fuente original

admin

Aviso de privacidad

Súbete a la ola del IoT

Contacto

Please Share This Compartir este contenido

admin

También podría gustarte

La descarga: Cómo derretir rocas y lo que necesitas saber sobre AI

Medir y mitigar el sesgo de identidad en el debate entre múltiples agentes mediante la anonimización

Generación de escenarios adversos a través de la alineación de preferencias de tiempo de prueba

Aviso de privacidad

test

Súbete a la ola del IoT

Contacto

Compartir este contenido