En este momento estás viendo 
<span class="bsf-rt-reading-time"><span class="bsf-rt-display-label" prefix="Tiempo de lectura"></span> <span class="bsf-rt-display-time" reading_time="1"></span> <span class="bsf-rt-display-postfix" postfix="mins"></span></span><!-- .bsf-rt-reading-time -->Los modelos de idiomas grandes están alineados altamente con las clasificaciones humanas de estímulos emocionales

Los modelos de idiomas grandes están alineados altamente con las clasificaciones humanas de estímulos emocionales

  • Autor de la entrada:
  • Categoría de la entrada:Noticias externas

Resumen: Las emociones ejercen una inmensa influencia sobre el comportamiento humano y la cognición en tareas comunes y de alto estrés. Las discusiones sobre si o cómo integrar los modelos de idiomas grandes (LLM) en la vida cotidiana (por ejemplo, actuar como representantes o interactuar con los agentes humanos) deben informarse mediante la comprensión de cómo estas herramientas evalúan estímulos o situaciones cargadas emocionalmente. La alineación de un modelo con el comportamiento humano en estos casos puede informar la efectividad de los LLM para ciertos roles o interacciones. Para ayudar a construir este entendimiento, obtuvimos calificaciones de múltiples LLM populares para conjuntos de datos de palabras e imágenes que anteriormente fueron calificadas por su contenido emocional por los humanos. Descubrimos que al realizar las mismas tareas de calificación, GPT-4O respondió de manera muy similar a los participantes humanos a través de modalidades, estímulos y la mayoría de las escalas de calificación (r = 0.9 o más en muchos casos). Sin embargo, las clasificaciones de excitación estaban menos alineadas entre los evaluadores humanos y LLM, mientras que las clasificaciones de felicidad estaban muy alineadas. Los LLM en general se alinearon mejor dentro de un marco emocional de emoción de cinco categorías (felicidad, ira, tristeza, miedo, disgusto) que dentro de una organización bidimensional (excitación y valencia). Finalmente, las clasificaciones de LLM fueron sustancialmente más homogéneas que las calificaciones humanas. Juntos, estos resultados comienzan a describir cómo los agentes de LLM interpretan estímulos emocionales y destacan las similitudes y diferencias entre la inteligencia biológica y artificial en los dominios de comportamiento clave.

Publicado Originalme en export.arxiv.org El 20 de agosto de 2025.
Ver Fuente Original

admin

Usuario de administración del sitio web