XChoice: Evaluación explicable de la alineación entre la IA y los seres humanos en la toma de decisiones de elección restringida basada en un LLM

Resumen:Presentamos XChoice, un marco explicable para evaluar la alineación humana-IA en la toma de decisiones restringida. Yendo más allá del acuerdo de resultados, como la precisión y la puntuación F1, XChoice adapta un modelo de decisión basado en mecanismos a datos humanos y decisiones generadas por LLM, recuperando parámetros interpretables que capturan la importancia relativa de los factores de decisión, la sensibilidad a las restricciones y las compensaciones implícitas. La alineación se evalúa comparando estos vectores de parámetros entre modelos, opciones y subgrupos. Demostramos XChoice sobre la distribución del tiempo diario de los estadounidenses utilizando la Encuesta Estadounidense de Uso del Tiempo (ATUS) como verdad humana, revelando una alineación heterogénea entre modelos y actividades y una desalineación destacada concentrada en grupos negros y casados. Además, validamos la solidez de XChoice mediante un análisis de invariancia y evaluamos la mitigación específica con una intervención de generación aumentada de recuperación (RAG). En general, XChoice proporciona métricas basadas en mecanismos que diagnostican desalineaciones y respaldan mejoras informadas más allá de la coincidencia de resultados superficiales.

Publicado originalmente en export.arxiv.org el 18 de enero de 2026.
Ver fuente original

admin

Aviso de privacidad

Súbete a la ola del IoT

Contacto

Please Share This Compartir este contenido

admin

También podría gustarte

MIMIC-RD: ¿Pueden los LLM diagnosticar diferencialmente enfermedades raras en entornos clínicos del mundo real?

PaperScout: un agente autónomo para la búsqueda de artículos académicos con optimización de políticas a nivel de secuencia basada en procesos

EAA: Automatización de la caracterización de materiales con agentes modelo de lenguaje visual.

Aviso de privacidad

test

Súbete a la ola del IoT

Contacto

Compartir este contenido