Resumen:Obtener un modelo de preferencia implica formular a una persona, denominada tomador de decisiones, una serie de preguntas. Suponemos que estas preferencias pueden representarse mediante una función de valor aditivo. En este trabajo, interrogamos simultáneamente a dos tomadores de decisiones con el objetivo de obtener sus respectivas funciones de valor.
Leer más →
Resumen: Las IA se implementan cada vez más con mayor autonomía y capacidades, lo que aumenta el riesgo de que una IA desalineada pueda causar daños catastróficos. El monitoreo no confiable (usar un modelo no confiable para supervisar otro) es un enfoque para reducir el riesgo.
Leer más →
Resumen: El término “equidad algorítmica” se utiliza para evaluar si los modelos de IA funcionan de manera justa tanto en contextos comparativos (donde la equidad se entiende como igualdad formal, como “tratar casos similares como similares”) como no comparativos (donde la injusticia surge de la inexactitud, arbitrariedad o inescrutabilidad del modelo).
Leer más →