Hacia la persuasión estratégica con modelos de idiomas

Resumen: Los modelos de idiomas grandes (LLM) han demostrado fuertes capacidades persuasivas comparables a las de los humanos, ofreciendo beneficios prometedores al tiempo que plantea preocupaciones sociales sobre su despliegue. Sin embargo, evaluar sistemáticamente las capacidades persuasivas de los LLM es inherentemente desafiante, ya que la efectividad de la persuasión entre los humanos varía significativamente en diferentes dominios. En este artículo, adoptamos un enfoque impulsado por la teoría para proporcionar un marco escalable y de principios para medir las capacidades persuasivas de LLM. En tierra en el marco de persuasión bayesiana (BP), reutilizamos los conjuntos de datos de persuasión humanos humanos existentes para construir entornos para evaluar y capacitar a LLM en persuasión estratégica. Nuestros resultados revelan que los modelos fronterizos pueden lograr consistentemente altas ganancias de persuasión y exhibir estrategias de persuasión sofisticadas que se alineen con las predicciones teóricas. Sobre la base de esto, utilizamos el aprendizaje de refuerzo para capacitar a LLM para persuasión estratégica en nuestros entornos. Nuestros resultados también demuestran que incluso los LLM pequeños pueden obtener ganancias de persuasión significativamente más altas a través del aprendizaje de refuerzo.

Publicado Originalme en export.arxiv.org El 29 de septiembre de 2025.
Ver Fuente Original

admin

Aviso de privacidad

Súbete a la ola del IoT

Contacto

Please Share This Compartir este contenido

admin

También podría gustarte

Pensamiento-crítica gradual: un marco unificado para un razonamiento de LLM sólido e interpretable

Oculto a la vista: sondeo de razonamiento implícito en modelos de lenguaje multimodal

Sobre el efecto de las trampas en el ajedrez

Aviso de privacidad

test

Súbete a la ola del IoT

Contacto

Compartir este contenido