En este momento estás viendo 
<span class="bsf-rt-reading-time"><span class="bsf-rt-display-label" prefix="Tiempo de lectura"></span> <span class="bsf-rt-display-time" reading_time="1"></span> <span class="bsf-rt-display-postfix" postfix="mins"></span></span><!-- .bsf-rt-reading-time -->Detección de la autoconservación intrínseca e instrumental en agentes autónomos: el protocolo unificado de interés de continuación

Detección de la autoconservación intrínseca e instrumental en agentes autónomos: el protocolo unificado de interés de continuación

  • Autor de la entrada:
  • Categoría de la entrada:Noticias externas

Resumen: Probamos si los agentes con objetivos de continuación terminales (Tipo A) producen estados latentes con mayor entropía de entrelazamiento que los agentes cuya continuación es meramente instrumental (Tipo B). Un mayor entrelazamiento refleja un acoplamiento estadístico entre particiones más fuerte.
En agentes de gridworld con objetivos de verdad terrestre conocidos, UCIP logra una precisión de detección del 100 % y 1,0 AUC-ROC en una evaluación no adversaria retenida bajo la puerta congelada de la Fase I. La brecha de entrelazamiento entre los agentes Tipo A y Tipo B es Delta = 0,381 (p <0,001, prueba de permutación). Pearson r = 0,934 en un barrido de interpolación de 11 puntos indica que, dentro de esta familia sintética, UCIP rastrea cambios graduales en la ponderación de continuación en lugar de simplemente una etiqueta binaria. Entre los modelos probados, sólo el QBM alcanza un Delta positivo. Todos los cálculos son clásicos; "cuanto" se refiere únicamente al formalismo matemático. La UCIP no detecta conciencia ni experiencia subjetiva; detecta estructura estadística en representaciones latentes que se correlacionan con objetivos conocidos.

Publicado originalmente en export.arxiv.org el 12 de marzo de 2026.
Ver fuente original

admin

Usuario de administración del sitio web