En este momento estás viendo 
<span class="bsf-rt-reading-time"><span class="bsf-rt-display-label" prefix="Tiempo de lectura"></span> <span class="bsf-rt-display-time" reading_time="2"></span> <span class="bsf-rt-display-postfix" postfix="mins"></span></span><!-- .bsf-rt-reading-time -->Colaboración y conflicto entre humanos y modelos de lenguaje a través de la lente de la teoría de juegos

Colaboración y conflicto entre humanos y modelos de lenguaje a través de la lente de la teoría de juegos

  • Autor de la entrada:
  • Categoría de la entrada:Noticias externas

Resumen: Los modelos de idiomas se implementan cada vez más en entornos en línea interactivos, desde asistentes de chat personales hasta agentes específicos del dominio, planteando preguntas sobre su comportamiento cooperativo y competitivo en entornos multipartidistas. Si bien el trabajo previo ha examinado la toma de decisiones del modelo de lenguaje en contextos teóricos aislados o a corto plazo, estos estudios a menudo descuidan las interacciones de Horizon Long, la colaboración del modelo humano y la evolución de los patrones de comportamiento a lo largo del tiempo. En este artículo, investigamos la dinámica del comportamiento del modelo de lenguaje en el dilema de prisioneros iterados (IPD), un marco clásico para estudiar la cooperación y el conflicto. Ponemos agentes basados ​​en modelos contra un conjunto de 240 estrategias clásicas bien establecidas en un torneo de estilo Axelrod y encontramos que los modelos de lenguaje logran el rendimiento a la par y, en algunos casos, excediendo las estrategias clásicas más conocidas. El análisis de comportamiento revela que los modelos de lenguaje exhiben propiedades clave asociadas con estrategias cooperativas sólidas: amabilidad, provocabilidad y generosidad, al tiempo que demuestran una rápida adaptabilidad a los cambios en la estrategia de oponente a mitad del juego. En los experimentos controlados de “cambio de estrategia”, los modelos de lenguaje detectan y responden a los cambios dentro de solo unas pocas rondas, rivalizan o superan la adaptabilidad humana. Estos resultados proporcionan la primera caracterización sistemática de los comportamientos cooperativos a largo plazo en los agentes del modelo de lenguaje, ofreciendo una base para futuras investigaciones sobre su papel en entornos sociales humanos más complejos y mixtos.

Publicado Originalme en export.arxiv.org El 7 de septiembre de 2025.
Ver Fuente Original

admin

Usuario de administración del sitio web