Colaboración y conflicto entre humanos y modelos de lenguaje a través de la lente de la teoría de juegos

Resumen: Los modelos de idiomas se implementan cada vez más en entornos en línea interactivos, desde asistentes de chat personales hasta agentes específicos del dominio, planteando preguntas sobre su comportamiento cooperativo y competitivo en entornos multipartidistas. Si bien el trabajo previo ha examinado la toma de decisiones del modelo de lenguaje en contextos teóricos aislados o a corto plazo, estos estudios a menudo descuidan las interacciones de Horizon Long, la colaboración del modelo humano y la evolución de los patrones de comportamiento a lo largo del tiempo. En este artículo, investigamos la dinámica del comportamiento del modelo de lenguaje en el dilema de prisioneros iterados (IPD), un marco clásico para estudiar la cooperación y el conflicto. Ponemos agentes basados en modelos contra un conjunto de 240 estrategias clásicas bien establecidas en un torneo de estilo Axelrod y encontramos que los modelos de lenguaje logran el rendimiento a la par y, en algunos casos, excediendo las estrategias clásicas más conocidas. El análisis de comportamiento revela que los modelos de lenguaje exhiben propiedades clave asociadas con estrategias cooperativas sólidas: amabilidad, provocabilidad y generosidad, al tiempo que demuestran una rápida adaptabilidad a los cambios en la estrategia de oponente a mitad del juego. En los experimentos controlados de “cambio de estrategia”, los modelos de lenguaje detectan y responden a los cambios dentro de solo unas pocas rondas, rivalizan o superan la adaptabilidad humana. Estos resultados proporcionan la primera caracterización sistemática de los comportamientos cooperativos a largo plazo en los agentes del modelo de lenguaje, ofreciendo una base para futuras investigaciones sobre su papel en entornos sociales humanos más complejos y mixtos.

Publicado Originalme en export.arxiv.org El 7 de septiembre de 2025.
Ver Fuente Original

admin

Aviso de privacidad

Súbete a la ola del IoT

Contacto

Please Share This Compartir este contenido

admin

También podría gustarte

Cultivación de inteligencia multimodal: razonamiento interpretativo y enfoques de trapo de agente para el diagnóstico dermatológico

Límites de implementación de IA segura: diferenciando la supervisión y el control

OpenEstimate: Evaluación de LLM sobre razonamiento en condiciones de incertidumbre con datos del mundo real

Aviso de privacidad

test

Súbete a la ola del IoT

Contacto

Compartir este contenido