En este momento estás viendo 
<span class="bsf-rt-reading-time"><span class="bsf-rt-display-label" prefix="Tiempo de lectura"></span> <span class="bsf-rt-display-time" reading_time="1"></span> <span class="bsf-rt-display-postfix" postfix="mins"></span></span><!-- .bsf-rt-reading-time -->Openha: una serie de modelos de agente jerárquicos de código abierto en Minecraft

Openha: una serie de modelos de agente jerárquicos de código abierto en Minecraft

  • Autor de la entrada:
  • Categoría de la entrada:Noticias externas

Resumen: La elección de los espacios de acción es un desafío crítico pero no resuelto en el desarrollo de agentes capacitables capaces y de extremo a extremo. Este documento presenta primero una comparación sistemática a gran escala de espacios de acción abstraídos prominentes y tokenizadores para modelos de agentes de acción en idioma de visión (VLA) o agente jerárquico en la Minecraft abierta. Nuestro análisis revela que ningún espacio de acción único es universalmente óptimo; En cambio, la abstracción más efectiva depende de la tarea, creando un dilema para construir agentes generalistas. Para resolver esto, introducimos la cadena de acción (COA), un marco novedoso que unifica la planificación de alto nivel y el control de bajo nivel dentro de un solo modelo VLA monolítico. COA trata una acción abstracta no como un comando para una política separada, sino como un paso de razonamiento intermedio, por una cadena de pensamiento, que guía la generación de la acción final y ejecutable. Además, demostramos que un agente todo en uno entrenado en una mezcla diversa de espacios de acción utilizando el paradigma de CoA aprende una política más robusta y generalizable. Este agente unificado logra un nuevo estado del arte, mejorando la tasa general de éxito de la tarea sobre las líneas de base fuertes y especializadas. Para fomentar la investigación reproducible, lanzamos la suite Openha (agentes jerárquicos abiertos), que incluye nuestro punto de referencia integral de más de 800 tareas distintas, conjuntos de datos seleccionados, código fuente y todos los puntos de control del modelo previamente esta URL HTTPS

Publicado Originalme en export.arxiv.org El 17 de septiembre de 2025.
Ver Fuente Original

admin

Usuario de administración del sitio web