En este momento estás viendo 
<span class="bsf-rt-reading-time"><span class="bsf-rt-display-label" prefix="Tiempo de lectura"></span> <span class="bsf-rt-display-time" reading_time="1"></span> <span class="bsf-rt-display-postfix" postfix="mins"></span></span><!-- .bsf-rt-reading-time -->Exploración a través de la introspección: un modelo de recompensa autoconsciente

Exploración a través de la introspección: un modelo de recompensa autoconsciente

  • Autor de la entrada:
  • Categoría de la entrada:Noticias externas

Resumen:Comprender cómo los agentes artificiales modelan los estados mentales internos es fundamental para avanzar en la Teoría de la Mente en la IA. La evidencia apunta a un sistema unificado para la conciencia de uno mismo y de los demás. Exploramos esta autoconciencia haciendo que agentes de aprendizaje por refuerzo infieren sus propios estados internos en entornos de gridworld. Específicamente, introducimos un componente de exploración introspectiva inspirado en el dolor biológico como señal de aprendizaje mediante la utilización de un modelo oculto de Markov para inferir la “creencia en el dolor” a partir de observaciones en línea. Esta señal se integra en una función de recompensa subjetiva para estudiar cómo la autoconciencia afecta las capacidades de aprendizaje del agente. Además, utilizamos este marco computacional para investigar la diferencia en el desempeño entre los modelos de percepción del dolor normal y crónico. Los resultados muestran que los agentes introspectivos en general superan significativamente a los agentes de referencia estándar y pueden replicar comportamientos complejos similares a los humanos.

Publicado originalmente en export.arxiv.org el 7 de enero de 2026.
Ver fuente original

admin

Usuario de administración del sitio web