HugAgent: Evaluación de LLM en la simulación del razonamiento individual similar al humano en tareas abiertas
Resumen: Simular el razonamiento humano en tareas abiertas ha sido una aspiración de larga data en la IA y la ciencia cognitiva. Si bien los grandes modelos lingüísticos ahora se aproximan a las respuestas humanas a escala, siguen sintonizados con el consenso a nivel de población, borrando a menudo la individualidad de los estilos de razonamiento y las trayectorias de creencias.
Leer más →