Resumen: Exploramos cómo diferentes tipos y usos de la memoria pueden ayudar a la navegación espacial en entornos cambiantes e inciertos. En la sencilla tarea de búsqueda de alimento que estudiamos todos los días, nuestro agente tiene que encontrar el camino desde su hogar, a través de barreras, hasta llegar a la comida. Además, el mundo no es estacionario: día a día, la ubicación de las barreras y los alimentos puede cambiar, y la sensación del agente, como la información de su ubicación, es incierta y muy limitada. Cualquier construcción de modelo, como un mapa, y uso, como la planificación, debe ser sólido frente a estos desafíos y, para que cualquier aprendizaje sea útil, debe ser lo suficientemente rápido. Analizamos una variedad de estrategias, desde simples hasta sofisticadas, con diversos usos de la memoria y el aprendizaje. Descubrimos que se requiere una arquitectura que pueda incorporar múltiples estrategias para manejar (sub)tareas de diferente naturaleza, en particular para la exploración y búsqueda, cuando se desconoce la ubicación de los alimentos, y para planificar un buen camino hacia una ubicación de alimentos recordada (probable). Un agente que utiliza técnicas de aprendizaje de probabilidad no estacionarias para seguir actualizando sus memorias (episódicas) y que utiliza esas memorias para construir mapas y planificar sobre la marcha (mapas imperfectos, es decir, ruidosos y limitados a la experiencia del agente) puede ser cada vez más y sustancialmente más eficiente que los agentes más simples (de memoria mínima), ya que aumentan las dificultades de la tarea, como la distancia al objetivo, siempre y cuando la incertidumbre, procedente de la localización y el cambio, no sea demasiado grande.
Publicado originalmente en export.arxiv.org el 17 de febrero de 2026.
Ver fuente original
