En este momento estás viendo 
<span class="bsf-rt-reading-time"><span class="bsf-rt-display-label" prefix="Tiempo de lectura"></span> <span class="bsf-rt-display-time" reading_time="2"></span> <span class="bsf-rt-display-postfix" postfix="mins"></span></span><!-- .bsf-rt-reading-time -->CAP-CoT: Aviso de confrontación de ciclo para mejorar la cadena de pensamientos en el razonamiento de LLM

CAP-CoT: Aviso de confrontación de ciclo para mejorar la cadena de pensamientos en el razonamiento de LLM

  • Autor de la entrada:
  • Categoría de la entrada:Noticias externas

Resumen: La estimulación de cadena de pensamiento (CoT) ha surgido como una forma sencilla y eficaz de obtener soluciones paso a paso a partir de grandes modelos de lenguaje (LLM). Sin embargo, el razonamiento CoT puede ser inestable en ejecuciones de problemas largos de varios pasos, lo que lleva a respuestas inconsistentes para tareas sin cambios. La mayor parte del trabajo anterior se centra en mejorar la cadena de razonamiento directo en una sola pasada, con menos atención a la corrección iterativa y contrastiva. Para abordar esta brecha, proponemos CAP-CoT, un marco de optimización de Cycle Adversarial Prompt diseñado para mejorar tanto la precisión del razonamiento CoT como la estabilidad de un único solucionador implementado. En cada ciclo, un solucionador directo genera cadenas de razonamiento candidatas, un retador adversario construye cadenas plausibles pero deliberadamente defectuosas utilizando estrategias de error específicas, y un agente de retroalimentación contrasta las dos cadenas y produce retroalimentación estructurada alineada por pasos. Esta retroalimentación cierra el ciclo de optimización en dos direcciones, incluida la actualización del mensaje del solucionador en función de los errores expuestos por el retador y la actualización del mensaje del retador para generar errores cada vez más específicos en ciclos posteriores. A diferencia de los mensajes de confrontación orientados a la seguridad, como los ataques de jailbreak o de inyección rápida, nuestro componente de confrontación es semántico de tareas y tiene como objetivo exponer vulnerabilidades lógicas en las cadenas de razonamiento. Los experimentos en seis puntos de referencia y cuatro pilares de LLM demuestran que dentro de dos o tres ciclos de optimización de avisos adversarios, CAP-CoT reduce constantemente la variabilidad entre ejecuciones al tiempo que mejora la precisión del razonamiento y la solidez para provocar perturbaciones.

Publicado originalmente en export.arxiv.org el 27 de abril de 2026.
Ver fuente original

admin

Usuario de administración del sitio web