Reina Roja digital: Evolución del programa adversario en Core War con LLM

Resumen: Los modelos de lenguaje grande (LLM) se utilizan cada vez más para desarrollar soluciones a problemas en muchos dominios, en un proceso inspirado en la evolución biológica. Sin embargo, a diferencia de la evolución biológica, la mayoría de los marcos de evolución de LLM se formulan como problemas de optimización estática, pasando por alto las dinámicas adversas abiertas que caracterizan los procesos evolutivos del mundo real. Aquí, estudiamos Digital Red Queen (DRQ), un algoritmo simple de autojuego que adopta estas dinámicas de la llamada “Reina Roja” a través de una adaptación continua a un objetivo cambiante. DRQ utiliza un LLM para desarrollar programas tipo ensamblaje, llamados guerreros, que compiten entre sí por el control de una máquina virtual en el juego Core War, un entorno completo de Turing estudiado en vida artificial y conectado con la ciberseguridad. En cada ronda de DRQ, el modelo desarrolla un nuevo guerrero para derrotar a todos los anteriores, produciendo una secuencia de guerreros adaptados. A lo largo de muchas rondas, observamos que los guerreros se vuelven cada vez más generales (en relación con un conjunto de guerreros humanos retenidos). Curiosamente, los guerreros también se vuelven menos diversos en cuanto a comportamiento en carreras independientes, lo que indica una presión de convergencia hacia una estrategia de comportamiento de propósito general, muy parecida a la evolución convergente en la naturaleza. Este resultado resalta el valor potencial de pasar de objetivos estáticos a objetivos dinámicos de la Reina Roja. Nuestro trabajo posiciona a Core War como una zona de pruebas rica y controlable para estudiar la adaptación adversaria en sistemas artificiales y para evaluar métodos de evolución basados en LLM. En términos más generales, la simplicidad y efectividad del DRQ sugieren que enfoques similarmente mínimos de autojuego podrían resultar útiles en otros dominios adversarios de múltiples agentes más prácticos, como la ciberseguridad del mundo real o la lucha contra la resistencia a las drogas.

Publicado originalmente en export.arxiv.org el 7 de enero de 2026.
Ver fuente original

admin

Aviso de privacidad

Súbete a la ola del IoT

Contacto

Please Share This Compartir este contenido

admin

También podría gustarte

Ericsson secures IoT/OT access with clientless ZTNA

Deepgraphlog para la IA neurosimbólica en capas

Thor: Optimización jerárquica integrada en herramientas a través de RL para el razonamiento matemático

Aviso de privacidad

test

Súbete a la ola del IoT

Contacto

Compartir este contenido