Resumen: La adquisición de características activas (AFA) es un paradigma adaptativo a instancia en el que, en el tiempo de prueba, una política elige secuencialmente qué características adquirir (a un costo) antes de predecir. Enfoques existentes, ya sea políticas de aprendizaje de refuerzo de trenes (RL), que se ocupan de un MDP difícil o políticas codiciosas que no puedan explicar la información conjunta de las características o requieren conocimiento sobre la distribución de datos subyacente. Para superar esto, proponemos la AFA (TAFA) basada en plantillas, un marco no grueso que aprende una pequeña biblioteca de plantillas de características, un conjunto de características que son conjuntamente informativas, y utiliza esta biblioteca de plantillas para guiar las próximas adquisiciones de características. Al identificar las plantillas de características, el marco propuesto no solo reduce significativamente el espacio de acción considerado por la política, sino que también alivia la necesidad de estimar la distribución de datos subyacente. Experimentos extensos en conjuntos de datos sintéticos y del mundo real muestran que TAFA supera a las líneas de base existentes de última generación al tiempo que alcanza el costo y el cálculo de adquisición general más bajos.
Publicado Originalme en export.arxiv.org El 26 de agosto de 2025.
Ver Fuente Original