Resumen: La generación de contenido procedimental (PCG) se ha convertido en una técnica cada vez más popular en el desarrollo de juegos, permitiendo a los desarrolladores generar entornos dinámicos, rejugables y escalables con un esfuerzo manual reducido. En este estudio, se propone un método novedoso para el diseño de niveles de procedimientos utilizando el aprendizaje por refuerzo profundo (DRL) dentro de un entorno 3D basado en Unity. El sistema consta de dos agentes: un agente colibrí, que actúa como solucionador, y un agente de isla flotante, responsable de generar y colocar objetos coleccionables (flores) en el terreno de forma realista y consciente del contexto. El colibrí se entrena utilizando el algoritmo de optimización de políticas próximas (PPO) del kit de herramientas Unity ML-Agents. Aprende a navegar por el terreno de manera eficiente, localizar flores y recolectarlas mientras se adapta al diseño de procedimientos en constante cambio de la isla. El agente de la isla también está capacitado utilizando el algoritmo de optimización de políticas próximas (PPO). Aprende a generar diseños de flores basándose en las posiciones de los obstáculos observados, el estado inicial del colibrí y los comentarios sobre el desempeño de episodios anteriores. La interacción entre estos agentes conduce a un comportamiento emergente y una generalización sólida en diversas configuraciones ambientales. Los resultados demuestran que el enfoque no sólo produce un comportamiento de agente efectivo y eficiente, sino que también abre nuevas oportunidades para el diseño de niveles de juego autónomo impulsado por el aprendizaje automático. Este trabajo destaca el potencial de DRL para permitir que agentes inteligentes generen y resuelvan contenido en entornos virtuales, ampliando los límites de lo que la IA puede aportar a los procesos creativos de desarrollo de juegos.
Publicado originalmente en export.arxiv.org el 19 de octubre de 2025.
Ver fuente original
