En este momento estás viendo 
<span class="bsf-rt-reading-time"><span class="bsf-rt-display-label" prefix="Tiempo de lectura"></span> <span class="bsf-rt-display-time" reading_time="2"></span> <span class="bsf-rt-display-postfix" postfix="mins"></span></span><!-- .bsf-rt-reading-time -->Cuando vale la pena recordar y planificar: navegar bajo el cambio

Cuando vale la pena recordar y planificar: navegar bajo el cambio

  • Autor de la entrada:
  • Categoría de la entrada:Noticias externas

Resumen: Exploramos cómo diferentes tipos y usos de la memoria pueden ayudar a la navegación espacial en entornos cambiantes e inciertos. En la sencilla tarea de búsqueda de alimento que estudiamos todos los días, nuestro agente tiene que encontrar el camino desde su hogar, a través de barreras, hasta llegar a la comida. Además, el mundo no es estacionario: día a día, la ubicación de las barreras y los alimentos puede cambiar, y la sensación del agente, como la información de su ubicación, es incierta y muy limitada. Cualquier construcción de modelo, como un mapa, y uso, como la planificación, debe ser sólido frente a estos desafíos y, para que cualquier aprendizaje sea útil, debe ser lo suficientemente rápido. Analizamos una variedad de estrategias, desde simples hasta sofisticadas, con diversos usos de la memoria y el aprendizaje. Descubrimos que se requiere una arquitectura que pueda incorporar múltiples estrategias para manejar (sub)tareas de diferente naturaleza, en particular para la exploración y búsqueda, cuando se desconoce la ubicación de los alimentos, y para planificar un buen camino hacia una ubicación de alimentos recordada (probable). Un agente que utiliza técnicas de aprendizaje de probabilidad no estacionarias para seguir actualizando sus memorias (episódicas) y que utiliza esas memorias para construir mapas y planificar sobre la marcha (mapas imperfectos, es decir, ruidosos y limitados a la experiencia del agente) puede ser cada vez más y sustancialmente más eficiente que los agentes más simples (de memoria mínima), ya que aumentan las dificultades de la tarea, como la distancia al objetivo, siempre y cuando la incertidumbre, procedente de la localización y el cambio, no sea demasiado grande.

Publicado originalmente en export.arxiv.org el 17 de febrero de 2026.
Ver fuente original

admin

Usuario de administración del sitio web