Resumen: Los modelos de idiomas grandes (LLM) han demostrado fuertes capacidades persuasivas comparables a las de los humanos, ofreciendo beneficios prometedores al tiempo que plantea preocupaciones sociales sobre su despliegue. Sin embargo, evaluar sistemáticamente las capacidades persuasivas de los LLM es inherentemente desafiante, ya que la efectividad de la persuasión entre los humanos varía significativamente en diferentes dominios. En este artículo, adoptamos un enfoque impulsado por la teoría para proporcionar un marco escalable y de principios para medir las capacidades persuasivas de LLM. En tierra en el marco de persuasión bayesiana (BP), reutilizamos los conjuntos de datos de persuasión humanos humanos existentes para construir entornos para evaluar y capacitar a LLM en persuasión estratégica. Nuestros resultados revelan que los modelos fronterizos pueden lograr consistentemente altas ganancias de persuasión y exhibir estrategias de persuasión sofisticadas que se alineen con las predicciones teóricas. Sobre la base de esto, utilizamos el aprendizaje de refuerzo para capacitar a LLM para persuasión estratégica en nuestros entornos. Nuestros resultados también demuestran que incluso los LLM pequeños pueden obtener ganancias de persuasión significativamente más altas a través del aprendizaje de refuerzo.
Publicado Originalme en export.arxiv.org El 29 de septiembre de 2025.
Ver Fuente Original