En este momento estás viendo 
<span class="bsf-rt-reading-time"><span class="bsf-rt-display-label" prefix="Tiempo de lectura"></span> <span class="bsf-rt-display-time" reading_time="1"></span> <span class="bsf-rt-display-postfix" postfix="mins"></span></span><!-- .bsf-rt-reading-time -->Rompiendo la maldición de la martingala: debate entre múltiples agentes a través de la energía potencial cognitiva asimétrica

Rompiendo la maldición de la martingala: debate entre múltiples agentes a través de la energía potencial cognitiva asimétrica

  • Autor de la entrada:
  • Categoría de la entrada:Noticias externas

Resumen: El debate entre agentes múltiples (MAD) ha surgido como un paradigma prometedor para mejorar el razonamiento de modelos de lenguaje grande. Sin embargo, un trabajo reciente revela una limitación: el MAD estándar no puede mejorar la corrección de las creencias más allá de la votación por mayoría; Nos referimos a esto como la maldición Martingala. Esta maldición surge porque los errores correlacionados hacen que los agentes converjan hacia un consenso erróneo, donde el debate simplemente refuerza los errores colectivos en lugar de filtrar el ruido. Proponemos AceMAD, un marco que rompe la maldición de la martingala al aprovechar la energía potencial cognitiva asimétrica para transformar MAD de un paseo aleatorio a un proceso de convergencia dirigido con deriva positiva. A través de un mecanismo de predicción de pares, los agentes predicen las distribuciones de creencias de sus pares, revelando un potencial cognitivo asimétrico: los poseedores de la verdad no sólo saben la respuesta correcta sino que también anticipan las ideas erróneas de la multitud, mientras que la mayoría alucinada permanece ciega a su error colectivo. Esta asimetría crea una brecha energética potencial que cuantificamos mediante reglas de puntuación estrictamente adecuadas. Probamos que este potencial cognitivo se manifiesta como superioridad teórica de la información y, bajo agregación no lineal, se convierte en una deriva submartingala hacia la verdad, rompiendo directamente la maldición Martingala. Los experimentos en subconjuntos desafiantes en seis puntos de referencia muestran que AceMAD recupera señales de verdad escasas incluso cuando las mayorías iniciales son incorrectas, superando sustancialmente los métodos de referencia.

Publicado originalmente en export.arxiv.org el 9 de marzo de 2026.
Ver fuente original

admin

Usuario de administración del sitio web