Resumen: La cognición espacial permite el comportamiento adaptativo dirigido a objetivos mediante la construcción de modelos internos de espacio. Los sistemas biológicos robustos consolidan el conocimiento espacial en tres formas interconectadas: Textit {Landmarks} Para señales salientes, Textit {Route Knowledge} para trayectorias de movimiento y Textit {Knowledge} para representaciones similares a mapas. Si bien los avances recientes en los modelos de lenguaje grande multimodal (MLLMS) han permitido un razonamiento de idioma visual en agentes incorporados, estos esfuerzos carecen de memoria espacial estructurada y, en cambio, operan de manera reactiva, limitando su generalización y adaptabilidad en entornos complejos del mundo real. Aquí presentamos la cognición espacial inspirada en el cerebro para la navegación (BSC-SAV), un marco unificado para construir y aprovechar la memoria espacial estructurada en agentes incorporados. BSC-SAV construye mapas cognitivos asocéntricos a partir de trayectorias egocéntricas y señales contextuales, y recupera dinámicamente el conocimiento espacial alineado con los objetivos semánticos. Integrado con potentes MLLM, BSC-SAV logra la eficacia y la eficiencia de última generación en diversas tareas de navegación, demuestra una fuerte generalización de disparo cero y respalda comportamientos versátiles encarnados en el mundo físico real, que ofrece un camino escalable y biológico hacia la inteligencia espacial de uso general.
Publicado Originalme en export.arxiv.org El 25 de agosto de 2025.
Ver Fuente Original