Resumen: La toma de decisiones secuencial dependiente del contexto se aborda comúnmente proporcionando el contexto explícitamente como entrada o aumentando la memoria recurrente para que la información contextual pueda representarse internamente. Estudiamos una tercera alternativa: realizar la dependencia contextual interviniendo en un estado latente recurrente compartido, sin ampliar la dimensionalidad recurrente. Con este fin, introducimos una arquitectura recurrente basada en intervenciones en la que un núcleo recurrente primero construye un estado latente previo a la intervención compartido, y luego el contexto actúa a través de un operador aditivo indexado por el contexto. Evaluamos esta idea en una tarea de decisión secuencial de cambio de contexto bajo observabilidad parcial. Comparamos tres familias de modelos: una línea de base asistida por etiquetas con acceso directo al contexto, una línea de base de memoria con estado recurrente ampliado y el modelo de intervención propuesto, que no utiliza entrada de contexto directa al núcleo recurrente ni crecimiento de la memoria. En el punto de referencia principal, el modelo de intervención tiene un buen desempeño sin dimensiones recurrentes adicionales. También evaluamos los modelos utilizando la información mutua condicional (I (C; O | S)) como una prueba operativa de dependencia contextual motivada por teoremas en un estado latente fijo. Para los resultados de la fase 1 relevantes para la tarea, el modelo de intervención muestra información contextual condicional positiva. En conjunto, estos resultados sugieren que la intervención en un estado recurrente compartido proporciona una alternativa viable al crecimiento de la memoria recurrente para el control contextual en este entorno.
Publicado originalmente en export.arxiv.org el 6 de abril de 2026.
Ver fuente original
