En este momento estás viendo 
<span class="bsf-rt-reading-time"><span class="bsf-rt-display-label" prefix="Tiempo de lectura"></span> <span class="bsf-rt-display-time" reading_time="1"></span> <span class="bsf-rt-display-postfix" postfix="mins"></span></span><!-- .bsf-rt-reading-time -->Anclas ocultas en la deliberación de LLM con múltiples agentes

Anclas ocultas en la deliberación de LLM con múltiples agentes

  • Autor de la entrada:
  • Categoría de la entrada:Noticias externas

Resumen: La deliberación de LLM con múltiples agentes, donde los agentes intercambian y revisan respuestas durante varias rondas, se utiliza cada vez más para mejorar el razonamiento y la precisión, pero rara vez se modela cómo y por qué funciona. Esta deliberación refleja cómo los humanos toman decisiones. Como animales sociales, somos arrastrados tanto por el grupo, el efecto rebaño que capturan los modelos clásicos de dinámica de opinión como DeGroot y Friedkin-Johnsen, como por nuestra propia creencia interna, que no capturan. Modelamos la deliberación de múltiples agentes como un sistema dinámico de circuito cerrado en el que cada agente lleva una creencia interna oculta, su ancla, que continuamente atrae su opinión independientemente de sus vecinos. Mostramos que este ancla puede recuperarse únicamente a partir de la deliberación, y que explica un comportamiento que las reglas de consenso clásicas prohíben: la confianza de un agente en la respuesta correcta puede trepar más allá de donde comenzó cualquier agente, escapando del espacio (casco convexo) formado por las creencias iniciales. Verificar si el ancla recuperada también predice ejecuciones retenidas (generaliza) proporciona una prueba simple para determinar cuándo un modelo está realmente impulsado por dicho ancla. En tres familias de modelos de peso abierto, este es un espectro, no un todo o nada. La influencia de todas las anclas es aproximadamente igual de fuerte, pero difieren en dónde se asienta el ancla, y sólo cuando se asienta lejos de las opiniones iniciales la deliberación escapa del casco y necesita el modelo de circuito cerrado completo.

Publicado originalmente en export.arxiv.org el 18 de junio de 2026.
Ver fuente original

admin

Usuario de administración del sitio web