En este momento estás viendo 
<span class="bsf-rt-reading-time"><span class="bsf-rt-display-label" prefix="Tiempo de lectura"></span> <span class="bsf-rt-display-time" reading_time="1"></span> <span class="bsf-rt-display-postfix" postfix="mins"></span></span><!-- .bsf-rt-reading-time -->Identidad como atractor: evidencia geométrica de la arquitectura de agentes persistentes en el espacio de activación de LLM

Identidad como atractor: evidencia geométrica de la arquitectura de agentes persistentes en el espacio de activación de LLM

  • Autor de la entrada:
  • Categoría de la entrada:Noticias externas

Resumen: Los modelos de lenguaje grandes asignan indicaciones relacionadas semánticamente con representaciones internas similares, un fenómeno interpretable como una dinámica similar a un atractor. Nos preguntamos si el documento de identidad de un agente cognitivo persistente (su núcleo cognitivo) exhibe un comportamiento similar al de un atractor. Presentamos un experimento controlado en Llama 3.1 8B Instruct, comparando estados ocultos de un núcleo cognitivo original (Condición A), siete paráfrasis (Condición B) y siete controles estructuralmente emparejados (Condición C). Los estados combinados de medias en las capas 8, 16 y 24 muestran que las paráfrasis convergen a un grupo más estrecho que los controles (d de Cohen > 1,88, p < 10^{-27}, corregido por Bonferroni). La replicación en Gemma 2 9B confirma la generalización entre arquitecturas. Las ablaciones sugieren que el efecto es principalmente semántico más que estructural, y que la integridad estructural parece necesaria para alcanzar la región del atractor. Un experimento exploratorio muestra que leer una descripción científica del agente cambia el estado interno hacia el atractor -más cerca que una preimpresión falsa-, distinguiendo conocer una identidad de operar como esa identidad. Estos resultados proporcionan evidencia representacional de que los documentos de identidad de los agentes inducen una geometría similar a un atractor en el espacio de activación de LLM.

Publicado originalmente en export.arxiv.org el 14 de abril de 2026.
Ver fuente original

admin

Usuario de administración del sitio web