HGFormer: un marco de transformador de gráficos jerárquicos para juegos de dos etapas del coronel Blotto a través del aprendizaje de refuerzo

Resumen: El Juego del Coronel Blotto de dos etapas representa un problema típico de asignación de recursos adversos, en el que dos agentes opuestos asignan secuencialmente recursos en una topología de red en dos fases: una implementación inicial de recursos seguido de múltiples rondas de ajustes de reasignación dinámica. La dependencia secuencial entre las etapas de juego y las complejas limitaciones impuestas por la topología del gráfico dificulta que los enfoques tradicionales alcancen una estrategia globalmente óptima. Para abordar estos desafíos, proponemos un marco de transformadores de gráficos jerárquicos llamado HGFormer. Al incorporar un codificador de transformador gráfico mejorado con sesgos estructurales y un modelo de decisión jerárquica de dos agentes, nuestro enfoque permite una generación de políticas eficiente en entornos adversos a gran escala. Además, diseñamos un algoritmo de aprendizaje de refuerzo de retroalimentación de capa por capa que alimenta los retornos a largo plazo de las decisiones de nivel inferior a la optimización de la estrategia de nivel superior, lo que supera la brecha de coordinación entre las dos etapas de toma de decisiones. Los resultados experimentales demuestran que, en comparación con la toma de decisiones jerárquicas existentes o los métodos de red neuronal gráfica, HGFormer mejora significativamente la eficiencia de la asignación de recursos y el pago adversario, logrando un rendimiento general superior en escenarios de juegos dinámicos complejos.

Publicado Originalme en rss.arxiv.org El 10 de junio de 2025.
Ver Fuente Original

admin

Aviso de privacidad

Súbete a la ola del IoT

Contacto

Please Share This Compartir este contenido

admin

También podría gustarte

Este punto de referencia usó AITA de Reddit para probar cuánto modelos de IA nos apestan

La Fundación Linux revela el programa de eventos globales 2026, que promueve la IA de código abierto y permite la innovación basada en la comunidad

La próxima guerra de Estados Unidos por la regulación de la IA

Aviso de privacidad

test

Súbete a la ola del IoT

Contacto

Compartir este contenido