En este momento estás viendo 
<span class="bsf-rt-reading-time"><span class="bsf-rt-display-label" prefix="Tiempo de lectura"></span> <span class="bsf-rt-display-time" reading_time="1"></span> <span class="bsf-rt-display-postfix" postfix="mins"></span></span><!-- .bsf-rt-reading-time -->Game-TARS: modelos básicos previamente entrenados para agentes de juegos multimodales generalistas escalables

Game-TARS: modelos básicos previamente entrenados para agentes de juegos multimodales generalistas escalables

  • Autor de la entrada:
  • Categoría de la entrada:Noticias externas

Resumen:Presentamos Game-TARS, un agente de juego generalista entrenado con un espacio de acción unificado y escalable anclado a entradas nativas de teclado y mouse alineadas por humanos. A diferencia de los enfoques basados ​​en API o GUI, este paradigma permite un entrenamiento previo continuo a gran escala en dominios heterogéneos, incluidos sistemas operativos, web y juegos de simulación. Game-TARS está previamente entrenado en más de 500 mil millones de tokens con diversas trayectorias y datos multimodales. Las técnicas clave incluyen una pérdida continua decreciente para reducir la confusión causal y una estrategia eficiente de pensamiento disperso que equilibra la profundidad del razonamiento y el costo de la inferencia. Los experimentos muestran que Game-TARS logra aproximadamente 2 veces la tasa de éxito con respecto al modelo sota anterior en tareas de Minecraft de mundo abierto, está cerca de la generalidad de humanos nuevos en juegos web 3D invisibles y supera a GPT-5, Gemini-2.5-Pro ​​y Claude-4-Sonnet en los puntos de referencia de FPS. Los resultados de escala en el tiempo de entrenamiento y el tiempo de prueba confirman que el espacio de acción unificado mantiene mejoras cuando se escala a datos multimodales y entre juegos. Nuestros resultados demuestran que las representaciones de acciones simples y escalables combinadas con un entrenamiento previo a gran escala brindan un camino prometedor hacia agentes generalistas con amplias habilidades de uso de computadoras.

Publicado originalmente en export.arxiv.org el 28 de octubre de 2025.
Ver fuente original

admin

Usuario de administración del sitio web