En este momento estás viendo 
<span class="bsf-rt-reading-time"><span class="bsf-rt-display-label" prefix="Tiempo de lectura"></span> <span class="bsf-rt-display-time" reading_time="1"></span> <span class="bsf-rt-display-postfix" postfix="mins"></span></span><!-- .bsf-rt-reading-time -->Mida lo que importa: evaluación psicométrica de la IA con pruebas de juicio situacional

Mida lo que importa: evaluación psicométrica de la IA con pruebas de juicio situacional

  • Autor de la entrada:
  • Categoría de la entrada:Noticias externas

Resumen:La psicometría de la IA evalúa los sistemas de IA en roles que tradicionalmente requieren juicio emocional y consideración ética. El trabajo anterior a menudo reutiliza inventarios de rasgos humanos (Big Five, hexaco) o personas ad hoc, lo que limita el realismo conductual y la relevancia del dominio. Proponemos un marco que (1) utiliza pruebas de juicio situacional (SJT) a partir de escenarios realistas para investigar competencias específicas de dominio; (2) integra la psicología industrial-organizacional y de la personalidad para diseñar personas sofisticadas que incluyen descriptores psicológicos y de comportamiento, historia de vida y funciones sociales y emocionales; y (3) emplea generación estructurada con antecedentes demográficos de la población y narrativas inspiradas en memorias, codificadas con esquemas Pydantic. En un estudio de caso de asistente de aplicación de la ley, construimos un rico conjunto de datos de personas dibujadas en 8 arquetipos de persona y SJT en 11 atributos, y analizamos comportamientos en subpoblaciones y sectores de escenarios. El conjunto de datos abarca 8500 personas, 4000 SJT y 300 000 respuestas. Lanzaremos el conjunto de datos y todo el código al público.

Publicado originalmente en export.arxiv.org el 27 de octubre de 2025.
Ver fuente original

admin

Usuario de administración del sitio web