Resumen: Introducimos el marco de los juegos LLM-Stackelberg, una clase de modelos de toma de decisiones secuenciales que integran modelos de idiomas grandes (LLM) en interacciones estratégicas entre un líder y un seguidor. Al parecer de los supuestos clásicos de Stackelberg de información completa y agentes racionales, nuestra formulación permite a cada agente razonar a través de indicaciones estructuradas, generar comportamientos probabilísticos a través de LLM y adaptar sus estrategias a través de la cognición interna y las actualizaciones de creencias. Definimos dos conceptos de equilibrio: razonamiento y equilibrio conductual, que alinea el razonamiento interno basado en aviso de un agente con un comportamiento observable y el equilibrio de razonamiento conjetural, que explica la incertidumbre epistémica a través de modelos parametrizados sobre la respuesta de un oponente. Estas construcciones en capas capturan la racionalidad limitada, la información asimétrica y la adaptación meta-cognitiva. Ilustramos el marco a través de un estudio de caso de Spearphishing, donde un remitente y un destinatario participan en un juego de engaño utilizando indicaciones de razonamiento estructurado. Este ejemplo destaca la riqueza cognitiva y el potencial adversario de las interacciones mediadas por LLM. Nuestros resultados muestran que los juegos LLM-Stackelberg proporcionan un poderoso paradigma para modelar la toma de decisiones en dominios como la seguridad cibernética, la información errónea y los sistemas de recomendación.
Publicado Originalme en export.arxiv.org El 14 de julio de 2025.
Ver Fuente Original