En este momento estás viendo 
<span class="bsf-rt-reading-time"><span class="bsf-rt-display-label" prefix="Tiempo de lectura"></span> <span class="bsf-rt-display-time" reading_time="1"></span> <span class="bsf-rt-display-postfix" postfix="mins"></span></span><!-- .bsf-rt-reading-time -->EmboMatrix: un campo de entrenamiento escalable para la toma de decisiones incorporada

EmboMatrix: un campo de entrenamiento escalable para la toma de decisiones incorporada

  • Autor de la entrada:
  • Categoría de la entrada:Noticias externas

Resumen:La toma de decisiones incorporada permite a los agentes traducir objetivos de alto nivel en acciones ejecutables a través de interacciones continuas dentro del mundo físico, formando una piedra angular de la inteligencia incorporada de propósito general. Los modelos de lenguajes grandes (LLM), con sus capacidades generales de toma de decisiones, ofrecen un camino prometedor para aprovechar este potencial; sin embargo, los LLM formados únicamente en lenguaje carecen de exposición a entornos físicos, lo que limita su verdadera comprensión corporal. Para cerrar esta brecha, proponemos el concepto de un campo de entrenamiento: una infraestructura integral que proporciona simulación de tareas y escenas, interacción incorporada y señales de retroalimentación, ofreciendo una solución integral para que LLM adquiera habilidades genuinas de toma de decisiones incorporadas. En este trabajo, presentamos EmboMatrix, el primer campo de entrenamiento de su tipo, que proporciona tareas masivas y diversas con simulación eficiente y recompensas precisas. EmboMatrix incorpora una serie de técnicas novedosas: un motor de datos multiagente para generación de escenas y tareas a gran escala, un sistema de hardware heterogéneo distribuido para simulación escalable y una arquitectura de recompensa multinivel para una supervisión precisa. Aprovechando EmboMatrix, cultivamos EmboBrain, un LLM cuyas habilidades de toma de decisiones corporeizadas surgen de extensas interacciones corporeizadas. Los experimentos muestran que EmboBrain-7B supera la línea de base 671B DeepSeek-R1 en un 9,5% en dos desafiantes puntos de referencia de toma de decisiones incorporadas, lo que demuestra el poder del aprendizaje interactivo y basado en el entorno para construir agentes incorporados verdaderamente inteligentes.

Publicado originalmente en export.arxiv.org el 14 de octubre de 2025.
Ver fuente original

admin

Usuario de administración del sitio web