Cuando vale la pena recordar y planificar: navegar bajo el cambio

Resumen: Exploramos cómo diferentes tipos y usos de la memoria pueden ayudar a la navegación espacial en entornos cambiantes e inciertos. En la sencilla tarea de búsqueda de alimento que estudiamos todos los días, nuestro agente tiene que encontrar el camino desde su hogar, a través de barreras, hasta llegar a la comida. Además, el mundo no es estacionario: día a día, la ubicación de las barreras y los alimentos puede cambiar, y la sensación del agente, como la información de su ubicación, es incierta y muy limitada. Cualquier construcción de modelo, como un mapa, y uso, como la planificación, debe ser sólido frente a estos desafíos y, para que cualquier aprendizaje sea útil, debe ser lo suficientemente rápido. Analizamos una variedad de estrategias, desde simples hasta sofisticadas, con diversos usos de la memoria y el aprendizaje. Descubrimos que se requiere una arquitectura que pueda incorporar múltiples estrategias para manejar (sub)tareas de diferente naturaleza, en particular para la exploración y búsqueda, cuando se desconoce la ubicación de los alimentos, y para planificar un buen camino hacia una ubicación de alimentos recordada (probable). Un agente que utiliza técnicas de aprendizaje de probabilidad no estacionarias para seguir actualizando sus memorias (episódicas) y que utiliza esas memorias para construir mapas y planificar sobre la marcha (mapas imperfectos, es decir, ruidosos y limitados a la experiencia del agente) puede ser cada vez más y sustancialmente más eficiente que los agentes más simples (de memoria mínima), ya que aumentan las dificultades de la tarea, como la distancia al objetivo, siempre y cuando la incertidumbre, procedente de la localización y el cambio, no sea demasiado grande.

Publicado originalmente en export.arxiv.org el 17 de febrero de 2026.
Ver fuente original

admin

Aviso de privacidad

Súbete a la ola del IoT

Contacto

Please Share This Compartir este contenido

admin

También podría gustarte

Arquitectos computacionales de la sociedad: aprendizaje automático cuántico para el génesis de las reglas sociales

Aprendizaje continuo sin memoria con adaptación al espacio nulo para modelos de lenguaje-visión de disparo cero

El punto de referencia MUSE: sondeo de la percepción musical y el razonamiento relacional auditivo en audio LLMS

Aviso de privacidad

test

Súbete a la ola del IoT

Contacto

Compartir este contenido