En este momento estás viendo 
<span class="bsf-rt-reading-time"><span class="bsf-rt-display-label" prefix="Tiempo de lectura"></span> <span class="bsf-rt-display-time" reading_time="1"></span> <span class="bsf-rt-display-postfix" postfix="mins"></span></span><!-- .bsf-rt-reading-time -->Juegos de LLM-Stackelberg: equilibrios de razonamiento conjetural y sus aplicaciones a SpearPhishing

Juegos de LLM-Stackelberg: equilibrios de razonamiento conjetural y sus aplicaciones a SpearPhishing

  • Autor de la entrada:
  • Categoría de la entrada:Noticias externas

Resumen: Introducimos el marco de los juegos LLM-Stackelberg, una clase de modelos de toma de decisiones secuenciales que integran modelos de idiomas grandes (LLM) en interacciones estratégicas entre un líder y un seguidor. Al parecer de los supuestos clásicos de Stackelberg de información completa y agentes racionales, nuestra formulación permite a cada agente razonar a través de indicaciones estructuradas, generar comportamientos probabilísticos a través de LLM y adaptar sus estrategias a través de la cognición interna y las actualizaciones de creencias. Definimos dos conceptos de equilibrio: razonamiento y equilibrio conductual, que alinea el razonamiento interno basado en aviso de un agente con un comportamiento observable y el equilibrio de razonamiento conjetural, que explica la incertidumbre epistémica a través de modelos parametrizados sobre la respuesta de un oponente. Estas construcciones en capas capturan la racionalidad limitada, la información asimétrica y la adaptación meta-cognitiva. Ilustramos el marco a través de un estudio de caso de Spearphishing, donde un remitente y un destinatario participan en un juego de engaño utilizando indicaciones de razonamiento estructurado. Este ejemplo destaca la riqueza cognitiva y el potencial adversario de las interacciones mediadas por LLM. Nuestros resultados muestran que los juegos LLM-Stackelberg proporcionan un poderoso paradigma para modelar la toma de decisiones en dominios como la seguridad cibernética, la información errónea y los sistemas de recomendación.

Publicado Originalme en export.arxiv.org El 14 de julio de 2025.
Ver Fuente Original

admin

Usuario de administración del sitio web