Los modelos de idiomas grandes están alineados altamente con las clasificaciones humanas de estímulos emocionales

Resumen: Las emociones ejercen una inmensa influencia sobre el comportamiento humano y la cognición en tareas comunes y de alto estrés. Las discusiones sobre si o cómo integrar los modelos de idiomas grandes (LLM) en la vida cotidiana (por ejemplo, actuar como representantes o interactuar con los agentes humanos) deben informarse mediante la comprensión de cómo estas herramientas evalúan estímulos o situaciones cargadas emocionalmente. La alineación de un modelo con el comportamiento humano en estos casos puede informar la efectividad de los LLM para ciertos roles o interacciones. Para ayudar a construir este entendimiento, obtuvimos calificaciones de múltiples LLM populares para conjuntos de datos de palabras e imágenes que anteriormente fueron calificadas por su contenido emocional por los humanos. Descubrimos que al realizar las mismas tareas de calificación, GPT-4O respondió de manera muy similar a los participantes humanos a través de modalidades, estímulos y la mayoría de las escalas de calificación (r = 0.9 o más en muchos casos). Sin embargo, las clasificaciones de excitación estaban menos alineadas entre los evaluadores humanos y LLM, mientras que las clasificaciones de felicidad estaban muy alineadas. Los LLM en general se alinearon mejor dentro de un marco emocional de emoción de cinco categorías (felicidad, ira, tristeza, miedo, disgusto) que dentro de una organización bidimensional (excitación y valencia). Finalmente, las clasificaciones de LLM fueron sustancialmente más homogéneas que las calificaciones humanas. Juntos, estos resultados comienzan a describir cómo los agentes de LLM interpretan estímulos emocionales y destacan las similitudes y diferencias entre la inteligencia biológica y artificial en los dominios de comportamiento clave.

Publicado Originalme en export.arxiv.org El 20 de agosto de 2025.
Ver Fuente Original

admin

Aviso de privacidad

Súbete a la ola del IoT

Contacto

Please Share This Compartir este contenido

admin

También podría gustarte

Esquina de rompecabezas

Visiomath: Benchmarking Mathematical Razoning en LMMS en LMM

La descarga: America’s Drone Brothers, y una ventaja del doomerismo de AI

Aviso de privacidad

test

Súbete a la ola del IoT

Contacto

Compartir este contenido