Resumen: Introducimos PuzzleJax, un motor de juego de rompecabezas acelerado por GPU y un lenguaje de descripción diseñado para admitir la evaluación comparativa rápida de la búsqueda de árboles, el aprendizaje de refuerzo y las habilidades de razonamiento LLM. A diferencia de los entornos de aprendizaje acelerados por GPU existentes que proporcionan implementaciones codificadas de juegos fijos de juegos, Puzzlejax permite la compilación dinámica de cualquier juego expresable en su lenguaje específico de dominio (DSL). Este DSL sigue Puzzlescript, que es un motor de juegos en línea popular y accesible para diseñar juegos de rompecabezas. En este artículo, validamos en Puzzlejax varios cientos de miles de juegos diseñados en Puzzlescript por diseñadores profesionales y creadores casuales desde su lanzamiento en 2013, demostrando así la cobertura de Puzzlejax de un espacio de tareas expansivo, expresivo y relevante humano. Al analizar el rendimiento de la búsqueda, el aprendizaje y los modelos de idiomas en estos juegos, mostramos que Puzzlejax puede expresar naturalmente tareas que son simples e intuitivas de entender, pero a menudo profundamente desafiantes para dominar, lo que requiere una combinación de control, planificación y información de alto nivel.
Publicado Originalme en export.arxiv.org El 25 de agosto de 2025.
Ver Fuente Original
