Diagnóstico del sesgo de recuperación bajo múltiples actualizaciones de conocimiento en contexto en modelos de lenguaje grandes

Resumen: Los LLM se utilizan ampliamente en tareas intensivas en conocimiento donde el mismo hecho puede revisarse varias veces dentro de su contexto. A diferencia de trabajos anteriores que se centran en actualizaciones únicas o conflictos únicos, los escenarios de actualizaciones múltiples contienen múltiples versiones históricamente válidas que compiten en la recuperación, pero aún permanecen inexploradas. Este desafío se asemeja al paradigma de interferencia AB-AC en psicología cognitiva: cuando la misma señal A se asocia sucesivamente con B y C, las asociaciones antiguas y nuevas compiten durante la recuperación, lo que genera sesgos. Inspirándonos en esto, presentamos un marco de evaluación de Instancias de conocimiento dinámico (DKI), que modela actualizaciones múltiples del mismo hecho como una señal combinada con una secuencia de valores actualizados, y evaluamos modelos mediante sondeo de puntos finales de los estados más tempranos (iniciales) y más recientes (actuales). En diversos LLM, observamos que el sesgo de recuperación se intensifica a medida que aumentan las actualizaciones, la precisión del estado más temprano se mantiene alta mientras que la precisión del estado más reciente cae sustancialmente. Los análisis de diagnóstico de la atención, la similitud del estado oculto y los logits de salida revelan además que estas señales se vuelven más planas y discriminan débilmente los errores, lo que proporciona una base poco estable para identificar la última actualización. Finalmente, las estrategias de intervención heurísticas de inspiración cognitiva producen sólo ganancias modestas y no eliminan el sesgo. Nuestros resultados revelan un desafío persistente en el seguimiento y seguimiento de las actualizaciones de conocimientos en contextos prolongados.

Publicado originalmente en export.arxiv.org el 15 de marzo de 2026.
Ver fuente original

admin

Aviso de privacidad

Súbete a la ola del IoT

Contacto

Please Share This Compartir este contenido

admin

También podría gustarte

Resumen de vídeo no supervisado guiado semánticamente

Benchmarking Modelos de idiomas grandes para orientación personalizada en el aprendizaje mejorado por AI

Un sistema basado en Llama-4 109b de Generation Llama-4 109 de recuperación automatizada para evaluar los planes de tratamiento de radioterapia

Aviso de privacidad

test

Súbete a la ola del IoT

Contacto

Compartir este contenido