CAP-CoT: Aviso de confrontación de ciclo para mejorar la cadena de pensamientos en el razonamiento de LLM

Resumen: La estimulación de cadena de pensamiento (CoT) ha surgido como una forma sencilla y eficaz de obtener soluciones paso a paso a partir de grandes modelos de lenguaje (LLM). Sin embargo, el razonamiento CoT puede ser inestable en ejecuciones de problemas largos de varios pasos, lo que lleva a respuestas inconsistentes para tareas sin cambios. La mayor parte del trabajo anterior se centra en mejorar la cadena de razonamiento directo en una sola pasada, con menos atención a la corrección iterativa y contrastiva. Para abordar esta brecha, proponemos CAP-CoT, un marco de optimización de Cycle Adversarial Prompt diseñado para mejorar tanto la precisión del razonamiento CoT como la estabilidad de un único solucionador implementado. En cada ciclo, un solucionador directo genera cadenas de razonamiento candidatas, un retador adversario construye cadenas plausibles pero deliberadamente defectuosas utilizando estrategias de error específicas, y un agente de retroalimentación contrasta las dos cadenas y produce retroalimentación estructurada alineada por pasos. Esta retroalimentación cierra el ciclo de optimización en dos direcciones, incluida la actualización del mensaje del solucionador en función de los errores expuestos por el retador y la actualización del mensaje del retador para generar errores cada vez más específicos en ciclos posteriores. A diferencia de los mensajes de confrontación orientados a la seguridad, como los ataques de jailbreak o de inyección rápida, nuestro componente de confrontación es semántico de tareas y tiene como objetivo exponer vulnerabilidades lógicas en las cadenas de razonamiento. Los experimentos en seis puntos de referencia y cuatro pilares de LLM demuestran que dentro de dos o tres ciclos de optimización de avisos adversarios, CAP-CoT reduce constantemente la variabilidad entre ejecuciones al tiempo que mejora la precisión del razonamiento y la solidez para provocar perturbaciones.

Publicado originalmente en export.arxiv.org el 27 de abril de 2026.
Ver fuente original

admin

Aviso de privacidad

Súbete a la ola del IoT

Contacto

Please Share This Compartir este contenido

admin

También podría gustarte

La descarga: Conozca a los jueces con AI y las promesas de salud de GPT-5

La Fundación Linux lanza OpenMDW-1.1; NVIDIA adopta OpenMDW para Cosmos, Isaac GR00T, Ising y Nemotron, familias de modelos de IA

Determinantes multinivel del sobrepeso y la obesidad entre niños estadounidenses de 10 a 17 años: evaluación comparativa de enfoques estadísticos y de aprendizaje automático utilizando la Encuesta Nacional de Salud Infantil de 2021

Aviso de privacidad

test

Súbete a la ola del IoT

Contacto

Compartir este contenido