Identidad como atractor: evidencia geométrica de la arquitectura de agentes persistentes en el espacio de activación de LLM

Resumen: Los modelos de lenguaje grandes asignan indicaciones relacionadas semánticamente con representaciones internas similares, un fenómeno interpretable como una dinámica similar a un atractor. Nos preguntamos si el documento de identidad de un agente cognitivo persistente (su núcleo cognitivo) exhibe un comportamiento similar al de un atractor. Presentamos un experimento controlado en Llama 3.1 8B Instruct, comparando estados ocultos de un núcleo cognitivo original (Condición A), siete paráfrasis (Condición B) y siete controles estructuralmente emparejados (Condición C). Los estados combinados de medias en las capas 8, 16 y 24 muestran que las paráfrasis convergen a un grupo más estrecho que los controles (d de Cohen > 1,88, p < 10^{-27}, corregido por Bonferroni). La replicación en Gemma 2 9B confirma la generalización entre arquitecturas. Las ablaciones sugieren que el efecto es principalmente semántico más que estructural, y que la integridad estructural parece necesaria para alcanzar la región del atractor. Un experimento exploratorio muestra que leer una descripción científica del agente cambia el estado interno hacia el atractor -más cerca que una preimpresión falsa-, distinguiendo conocer una identidad de operar como esa identidad. Estos resultados proporcionan evidencia representacional de que los documentos de identidad de los agentes inducen una geometría similar a un atractor en el espacio de activación de LLM.

Publicado originalmente en export.arxiv.org el 14 de abril de 2026.
Ver fuente original

admin

Aviso de privacidad

Súbete a la ola del IoT

Contacto

Please Share This Compartir este contenido

admin

También podría gustarte

UAVS de agente: autonomía impulsada por LLM con insultos integrados y razonamiento cognitivo

Con el aumento de los ciberataques por valor de 1 dólar, las defensas duraderas dan sus frutos

Plantillas de información: un nuevo paradigma para la adquisición de características activas inteligentes

Aviso de privacidad

test

Súbete a la ola del IoT

Contacto

Compartir este contenido