Resumen:La psicometría de la IA evalúa los sistemas de IA en roles que tradicionalmente requieren juicio emocional y consideración ética. El trabajo anterior a menudo reutiliza inventarios de rasgos humanos (Big Five, hexaco) o personas ad hoc, lo que limita el realismo conductual y la relevancia del dominio. Proponemos un marco que (1) utiliza pruebas de juicio situacional (SJT) a partir de escenarios realistas para investigar competencias específicas de dominio; (2) integra la psicología industrial-organizacional y de la personalidad para diseñar personas sofisticadas que incluyen descriptores psicológicos y de comportamiento, historia de vida y funciones sociales y emocionales; y (3) emplea generación estructurada con antecedentes demográficos de la población y narrativas inspiradas en memorias, codificadas con esquemas Pydantic. En un estudio de caso de asistente de aplicación de la ley, construimos un rico conjunto de datos de personas dibujadas en 8 arquetipos de persona y SJT en 11 atributos, y analizamos comportamientos en subpoblaciones y sectores de escenarios. El conjunto de datos abarca 8500 personas, 4000 SJT y 300 000 respuestas. Lanzaremos el conjunto de datos y todo el código al público.
Publicado originalmente en export.arxiv.org el 27 de octubre de 2025.
Ver fuente original
