Uso de refuerzo Aprender a capacitar a grandes modelos de idiomas para explicar las decisiones humanas

Resumen: Un objetivo central del modelado cognitivo es desarrollar modelos que no solo predicen el comportamiento humano, sino que también proporcionen información sobre los mecanismos cognitivos subyacentes. Si bien los modelos de redes neuronales entrenados en datos de comportamiento a gran escala a menudo logran un fuerte rendimiento predictivo, generalmente se quedan cortos en ofrecer explicaciones interpretables de los procesos cognitivos que capturan. En este trabajo, exploramos el potencial de los modelos de lenguaje grande previamente prenado (LLM) para servir como modelos cognitivos de doble propósito, con la capacidad de predicción precisa y la explicación interpretable en el lenguaje natural. Específicamente, empleamos el aprendizaje de refuerzo con recompensas basadas en resultados para guiar a LLM hacia la generación de trazas de razonamiento explícitas para explicar las elecciones de riesgo humano. Nuestros hallazgos demuestran que este enfoque produce explicaciones de alta calidad junto con fuertes predicciones cuantitativas de las decisiones humanas.

Publicado Originalme en rss.arxiv.org El 19 de mayo de 2025.
Ver Fuente Original

admin

Aviso de privacidad

Súbete a la ola del IoT

Contacto

Please Share This Compartir este contenido

admin

También podría gustarte

MRAG: dilucidar el espacio de diseño de la generación de recuperación multimodal

CloudFlare ahora, por defecto, bloqueará los bots de IA de rastrear los sitios web de sus clientes

Por qué no te puedes perder la cumbre de código abierto de este año Europa

Aviso de privacidad

test

Súbete a la ola del IoT

Contacto

Compartir este contenido