Resumen: Los modelos de idiomas se implementan cada vez más en entornos en línea interactivos, desde asistentes de chat personales hasta agentes específicos del dominio, planteando preguntas sobre su comportamiento cooperativo y competitivo en entornos multipartidistas. Si bien el trabajo previo ha examinado la toma de decisiones del modelo de lenguaje en contextos teóricos aislados o a corto plazo, estos estudios a menudo descuidan las interacciones de Horizon Long, la colaboración del modelo humano y la evolución de los patrones de comportamiento a lo largo del tiempo. En este artículo, investigamos la dinámica del comportamiento del modelo de lenguaje en el dilema de prisioneros iterados (IPD), un marco clásico para estudiar la cooperación y el conflicto. Ponemos agentes basados en modelos contra un conjunto de 240 estrategias clásicas bien establecidas en un torneo de estilo Axelrod y encontramos que los modelos de lenguaje logran el rendimiento a la par y, en algunos casos, excediendo las estrategias clásicas más conocidas. El análisis de comportamiento revela que los modelos de lenguaje exhiben propiedades clave asociadas con estrategias cooperativas sólidas: amabilidad, provocabilidad y generosidad, al tiempo que demuestran una rápida adaptabilidad a los cambios en la estrategia de oponente a mitad del juego. En los experimentos controlados de “cambio de estrategia”, los modelos de lenguaje detectan y responden a los cambios dentro de solo unas pocas rondas, rivalizan o superan la adaptabilidad humana. Estos resultados proporcionan la primera caracterización sistemática de los comportamientos cooperativos a largo plazo en los agentes del modelo de lenguaje, ofreciendo una base para futuras investigaciones sobre su papel en entornos sociales humanos más complejos y mixtos.
Publicado Originalme en export.arxiv.org El 7 de septiembre de 2025.
Ver Fuente Original
