Metamemoría: recuperar e integrar recuerdos semánticos espaciales para el razonamiento espacial de los robots

Resumen: La navegación de entornos complejos requiere que los robots almacenen observaciones de manera efectiva como recuerdos y los aprovechen para responder consultas humanas sobre las ubicaciones espaciales, que es un desafío de investigación crítico pero poco excesivo. Si bien el trabajo previo ha progresado en la construcción de la memoria robótica, pocos han abordado los mecanismos de principios necesarios para la recuperación e integración de memoria eficientes. Para cerrar esta brecha, proponemos MetaMemory, un agente impulsado por el modelo de lenguaje grande (LLM) que construye una representación de memoria de alta densidad del entorno. La innovación clave de la metamemería radica en su capacidad para recuperar e integrar recuerdos relevantes a través del razonamiento conjunto sobre las modalidades semánticas y espaciales en respuesta a las consultas de ubicación del lenguaje natural, lo que empodera a los robots con capacidades de razonamiento espacial robustas y precisas. Para evaluar su desempeño, presentamos Spacelocqa, un conjunto de datos a gran escala que abarca diversos escenarios de preguntas espaciales del mundo real. Los resultados experimentales muestran que la metamemoría supera significativamente los métodos de última generación tanto en los puntos de referencia de Spacelocqa como en los puntos de referencia de NAVQA público. Además, implementamos con éxito meta-memoria en plataformas robóticas del mundo real, demostrando su utilidad práctica en entornos complejos. Página del proyecto: esta URL HTTPS .

Publicado Originalme en export.arxiv.org El 25 de septiembre de 2025.
Ver Fuente Original

admin

Aviso de privacidad

Súbete a la ola del IoT

Contacto

Please Share This Compartir este contenido

admin

También podría gustarte

Aworld: sistema dinámico de múltiples agentes con maniobras estables para resolver problemas de Gaia

Q-ARDNS-MULTI: un marco de aprendizaje de refuerzo cuántico de múltiples agentes con adaptación meta-cognitiva para entornos 3D complejos

$ texttt {especificaciones} $: escala de tiempo de prueba más rápido a través de borradores especulativos

Aviso de privacidad

test

Súbete a la ola del IoT

Contacto

Compartir este contenido