Resumen:El pensamiento asociativo (la capacidad de conectar ideas aparentemente no relacionadas) es un elemento fundamental de la creatividad humana y la resolución de problemas. Este artículo explora si el aprendizaje por refuerzo (RL) guiado por principios de pensamiento asociativo puede mejorar el rendimiento de un modelo en diversas tareas generativas, incluida la redacción de historias, la generación de códigos y la creación de gráficos. Introducimos un marco de aprendizaje por refuerzo que utiliza un mecanismo de evaluación basado en indicaciones, incorporando métricas de pensamiento divergente establecidas a partir de la investigación de la creatividad. Un modelo de lenguaje base se afina utilizando este marco para recompensar los resultados que demuestran una mayor novedad a través de mayores grados de conectividad conceptual. Curiosamente, los resultados experimentales sugieren que los modelos entrenados en pensamiento asociativo basados en RL no solo generan historias más originales y coherentes, sino que también exhiben una mejor abstracción y flexibilidad en tareas como la programación y la visualización de datos. Nuestros hallazgos proporcionan evidencia inicial de que modelar los principios de la creatividad cognitiva mediante el aprendizaje por refuerzo puede generar una IA más adaptativa y generativa.
Publicado originalmente en export.arxiv.org el 25 de noviembre de 2025.
Ver fuente original
