Exploración a través de la introspección: un modelo de recompensa autoconsciente

Resumen:Comprender cómo los agentes artificiales modelan los estados mentales internos es fundamental para avanzar en la Teoría de la Mente en la IA. La evidencia apunta a un sistema unificado para la conciencia de uno mismo y de los demás. Exploramos esta autoconciencia haciendo que agentes de aprendizaje por refuerzo infieren sus propios estados internos en entornos de gridworld. Específicamente, introducimos un componente de exploración introspectiva inspirado en el dolor biológico como señal de aprendizaje mediante la utilización de un modelo oculto de Markov para inferir la “creencia en el dolor” a partir de observaciones en línea. Esta señal se integra en una función de recompensa subjetiva para estudiar cómo la autoconciencia afecta las capacidades de aprendizaje del agente. Además, utilizamos este marco computacional para investigar la diferencia en el desempeño entre los modelos de percepción del dolor normal y crónico. Los resultados muestran que los agentes introspectivos en general superan significativamente a los agentes de referencia estándar y pueden replicar comportamientos complejos similares a los humanos.

Publicado originalmente en export.arxiv.org el 7 de enero de 2026.
Ver fuente original

admin

Aviso de privacidad

Súbete a la ola del IoT

Contacto

Please Share This Compartir este contenido

admin

También podría gustarte

Enrutamiento de modelos explicables para flujos de trabajo agentes

AIRA_2: Superar los obstáculos en los agentes de investigación de IA

¿Qué tan incierta es la calificación? Un punto de referencia de métricas de incertidumbre para la evaluación automática basada en LLM

Aviso de privacidad

test

Súbete a la ola del IoT

Contacto

Compartir este contenido