Resumen: Los modelos de lenguaje grande se utilizan cada vez más en entornos estratégicos de toma de decisiones, pero la evidencia muestra que, como los humanos, a menudo se desvían de la plena racionalidad. En este estudio, comparamos LLM y humanos utilizando paradigmas experimentales directamente adaptados de la investigación de la teoría del juego conductual. Nos centramos en dos juegos estratégicos bien estudiados, las puestos de papel de rock y el dilema del prisionero, que son bien conocidos por revelar desviaciones sistemáticas del juego racional en sujetos humanos. Al colocar LLM en condiciones experimentales idénticas, evaluamos si sus comportamientos exhiben la racionalidad limitada característica de los humanos. Nuestros hallazgos muestran que los LLM reproducen la heurística humana familiar, como el cambio de estrategia basado en resultados y una mayor cooperación cuando es posible la interacción futura, pero aplican estas reglas de manera más rígida y demuestran una sensibilidad más débil a los cambios dinámicos en el entorno del juego. Los análisis a nivel de modelo revelan firmas arquitectónicas distintivas en el comportamiento estratégico, e incluso los modelos de razonamiento a veces luchan por encontrar estrategias efectivas en situaciones adaptativas. Estos resultados indican que los LLM actuales capturan solo una forma parcial de racionalidad limitada humana y destacan la necesidad de métodos de entrenamiento que fomenten el modelado de oponentes flexibles y la conciencia de contexto más fuerte.
Publicado Originalme en rss.arxiv.org El 11 de junio de 2025.
Ver Fuente Original