EmboMatrix: un campo de entrenamiento escalable para la toma de decisiones incorporada

Resumen:La toma de decisiones incorporada permite a los agentes traducir objetivos de alto nivel en acciones ejecutables a través de interacciones continuas dentro del mundo físico, formando una piedra angular de la inteligencia incorporada de propósito general. Los modelos de lenguajes grandes (LLM), con sus capacidades generales de toma de decisiones, ofrecen un camino prometedor para aprovechar este potencial; sin embargo, los LLM formados únicamente en lenguaje carecen de exposición a entornos físicos, lo que limita su verdadera comprensión corporal. Para cerrar esta brecha, proponemos el concepto de un campo de entrenamiento: una infraestructura integral que proporciona simulación de tareas y escenas, interacción incorporada y señales de retroalimentación, ofreciendo una solución integral para que LLM adquiera habilidades genuinas de toma de decisiones incorporadas. En este trabajo, presentamos EmboMatrix, el primer campo de entrenamiento de su tipo, que proporciona tareas masivas y diversas con simulación eficiente y recompensas precisas. EmboMatrix incorpora una serie de técnicas novedosas: un motor de datos multiagente para generación de escenas y tareas a gran escala, un sistema de hardware heterogéneo distribuido para simulación escalable y una arquitectura de recompensa multinivel para una supervisión precisa. Aprovechando EmboMatrix, cultivamos EmboBrain, un LLM cuyas habilidades de toma de decisiones corporeizadas surgen de extensas interacciones corporeizadas. Los experimentos muestran que EmboBrain-7B supera la línea de base 671B DeepSeek-R1 en un 9,5% en dos desafiantes puntos de referencia de toma de decisiones incorporadas, lo que demuestra el poder del aprendizaje interactivo y basado en el entorno para construir agentes incorporados verdaderamente inteligentes.

Publicado originalmente en export.arxiv.org el 14 de octubre de 2025.
Ver fuente original

admin

Aviso de privacidad

Súbete a la ola del IoT

Contacto

Please Share This Compartir este contenido

admin

También podría gustarte

Mantis: un modelo de base de simulación para el pronóstico de enfermedades

Taller de Identidades Desechables.

Dobla tu propia teselación

Aviso de privacidad

test

Súbete a la ola del IoT

Contacto

Compartir este contenido