Formación de asociaciones conjuntas emergentes: un enfoque de aprendizaje por refuerzo para el pensamiento creativo en modelos lingüísticos

Resumen:El pensamiento asociativo (la capacidad de conectar ideas aparentemente no relacionadas) es un elemento fundamental de la creatividad humana y la resolución de problemas. Este artículo explora si el aprendizaje por refuerzo (RL) guiado por principios de pensamiento asociativo puede mejorar el rendimiento de un modelo en diversas tareas generativas, incluida la redacción de historias, la generación de códigos y la creación de gráficos. Introducimos un marco de aprendizaje por refuerzo que utiliza un mecanismo de evaluación basado en indicaciones, incorporando métricas de pensamiento divergente establecidas a partir de la investigación de la creatividad. Un modelo de lenguaje base se afina utilizando este marco para recompensar los resultados que demuestran una mayor novedad a través de mayores grados de conectividad conceptual. Curiosamente, los resultados experimentales sugieren que los modelos entrenados en pensamiento asociativo basados en RL no solo generan historias más originales y coherentes, sino que también exhiben una mejor abstracción y flexibilidad en tareas como la programación y la visualización de datos. Nuestros hallazgos proporcionan evidencia inicial de que modelar los principios de la creatividad cognitiva mediante el aprendizaje por refuerzo puede generar una IA más adaptativa y generativa.

Publicado originalmente en export.arxiv.org el 25 de noviembre de 2025.
Ver fuente original

admin

Aviso de privacidad

Súbete a la ola del IoT

Contacto

Please Share This Compartir este contenido

admin

También podría gustarte

Operacionalización de la casualidad: flujos de trabajo de IA de múltiples agentes para la caracterización de materiales mejorados con teoría en el bucle

Escalado sobre escala: explorar el tiempo de prueba de escala Pareto en grandes modelos de razonamiento

Nano Bio-Agents (NBA): agentes modelo de lenguaje pequeño para la genómica

Aviso de privacidad

test

Súbete a la ola del IoT

Contacto

Compartir este contenido