Resumen: La navegación de entornos complejos requiere que los robots almacenen observaciones de manera efectiva como recuerdos y los aprovechen para responder consultas humanas sobre las ubicaciones espaciales, que es un desafío de investigación crítico pero poco excesivo. Si bien el trabajo previo ha progresado en la construcción de la memoria robótica, pocos han abordado los mecanismos de principios necesarios para la recuperación e integración de memoria eficientes. Para cerrar esta brecha, proponemos MetaMemory, un agente impulsado por el modelo de lenguaje grande (LLM) que construye una representación de memoria de alta densidad del entorno. La innovación clave de la metamemería radica en su capacidad para recuperar e integrar recuerdos relevantes a través del razonamiento conjunto sobre las modalidades semánticas y espaciales en respuesta a las consultas de ubicación del lenguaje natural, lo que empodera a los robots con capacidades de razonamiento espacial robustas y precisas. Para evaluar su desempeño, presentamos Spacelocqa, un conjunto de datos a gran escala que abarca diversos escenarios de preguntas espaciales del mundo real. Los resultados experimentales muestran que la metamemoría supera significativamente los métodos de última generación tanto en los puntos de referencia de Spacelocqa como en los puntos de referencia de NAVQA público. Además, implementamos con éxito meta-memoria en plataformas robóticas del mundo real, demostrando su utilidad práctica en entornos complejos. Página del proyecto: esta URL HTTPS .
Publicado Originalme en export.arxiv.org El 25 de septiembre de 2025.
Ver Fuente Original