En este momento estás viendo 
<span class="bsf-rt-reading-time"><span class="bsf-rt-display-label" prefix="Tiempo de lectura"></span> <span class="bsf-rt-display-time" reading_time="1"></span> <span class="bsf-rt-display-postfix" postfix="mins"></span></span><!-- .bsf-rt-reading-time -->Estrategia de escalamiento, no computación: un punto de referencia independiente y de código abierto de StarCraft II para la investigación de aprendizaje por refuerzo accesible

Estrategia de escalamiento, no computación: un punto de referencia independiente y de código abierto de StarCraft II para la investigación de aprendizaje por refuerzo accesible

  • Autor de la entrada:
  • Categoría de la entrada:Noticias externas

Resumen:La comunidad de investigación carece de un término medio entre el juego completo de StarCraft II y sus minijuegos. El extenso espacio de estado-acción de los juegos completos hace que las señales de recompensa sean escasas y ruidosas, pero en los minijuegos los agentes simples saturan el rendimiento. Esta brecha de complejidad obstaculiza el diseño curricular estable e impide que los investigadores experimenten con algoritmos modernos de aprendizaje por refuerzo en entornos RTS con presupuestos informáticos realistas. Para llenar este vacío, presentamos Two-Bridge Map Suite, la primera entrada de una serie de pruebas comparativas de código abierto que diseñamos deliberadamente como una prueba intermedia para ubicarse entre estos extremos. Al desactivar mecanismos económicos como la recolección de recursos, la construcción de bases y la niebla de guerra, el entorno aísla dos habilidades tácticas centrales: la navegación de largo alcance y el microcombate. Los experimentos preliminares muestran que los agentes aprenden maniobras coherentes y comportamientos de participación sin imponer costos computacionales de juego completo. Two-Bridge se lanza como un contenedor liviano compatible con Gym además de PySC2, con mapas, contenedores y scripts de referencia completamente de código abierto para fomentar una amplia adopción como punto de referencia estándar.

Publicado originalmente en export.arxiv.org el 9 de marzo de 2026.
Ver fuente original

admin

Usuario de administración del sitio web