Resumen: Documentamos límites de capacidad empíricos en modelos de lenguaje autorregresivos solo para decodificadores en tareas intensivas en conocimiento.
Leer más →
Resumen:La psicometría de la IA evalúa los sistemas de IA en roles que tradicionalmente requieren juicio emocional y consideración ética. El trabajo anterior a menudo reutiliza inventarios de rasgos humanos (Big Five, hexaco) o personas ad hoc, lo que limita el realismo conductual y la relevancia del dominio.
Leer más →
Resumen: Los sistemas de IA del mundo real están abordando problemas cada vez más complejos, a menudo a través de interacciones entre agentes de modelos de lenguaje grande (LLM). Cuando estos agentes desarrollan convenciones inconsistentes, la coordinación puede fallar.
Leer más →