Estrategias contrafactuales para los procesos de decisión de Markov

Resumen: Los contrafactuales se usan ampliamente en AI para explicar cómo los cambios mínimos en la entrada de un modelo pueden conducir a una salida diferente. Sin embargo, los métodos establecidos para calcular los contrafactuales generalmente se centran en la toma de decisiones de un solo paso, y no son directamente aplicables a las tareas de toma de decisiones secuenciales. Este documento llena este vacío al introducir estrategias contrafactuales para los procesos de decisión de Markov (MDP). Durante la ejecución de MDP, una estrategia decide cuál de las acciones habilitadas (con efectos probabilísticos conocidos) ejecuta a continuación. Dada una estrategia inicial que alcanza un resultado no deseado con una probabilidad por encima de algún límite, identificamos cambios mínimos en la estrategia inicial para reducir esa probabilidad por debajo del límite. Codificamos las estrategias contrafactuales como soluciones a los problemas de optimización no lineales, y ampliamos aún más nuestra codificación para sintetizar diversas estrategias contrafactuales. Evaluamos nuestro enfoque en cuatro conjuntos de datos del mundo real y demostramos su viabilidad práctica en tareas de toma de decisiones secuenciales sofisticadas.

Publicado Originalme en rss.arxiv.org El 14 de mayo de 2025.
Ver Fuente Original

admin

Aviso de privacidad

Súbete a la ola del IoT

Contacto

Please Share This Compartir este contenido

admin

También podría gustarte

Optimización de la cadena de suministro a través de la simulación generativa y las políticas de decisión iterativa

Serie de seminarios web-globales (14 y 16 de mayo 2025)

La gente usa la IA para “sentarse” con ellos mientras viajan en psicodélicos

Aviso de privacidad

test

Súbete a la ola del IoT

Contacto

Compartir este contenido