Panini: aprendizaje continuo en el espacio simbólico a través de la memoria estructurada

Resumen: Los modelos de lenguaje se utilizan cada vez más para razonar sobre contenidos en los que no fueron entrenados, como nuevos documentos, conocimientos en evolución y datos específicos de los usuarios. Un enfoque común es la generación aumentada de recuperación (RAG), que almacena documentos textuales externamente (como fragmentos) y recupera solo un subconjunto relevante en el momento de la inferencia para que un LLM razone. Sin embargo, esto da como resultado un uso ineficiente del cálculo en el momento de la prueba (LLM razona repetidamente sobre los mismos documentos); Además, la recuperación de fragmentos puede inyectar un contexto irrelevante que aumente la generación no compatible. Proponemos un marco de aprendizaje continuo no paramétrico similar al humano, donde el modelo base permanece fijo y el aprendizaje ocurre integrando cada nueva experiencia en un estado de memoria semántica externa que se acumula y consolida continuamente. Presentamos Panini, que se da cuenta de esto al representar documentos como Espacios de trabajo semánticos generativos (GSW), una red de pares de preguntas y respuestas (QA) consciente de entidades y eventos, suficiente para que un LLM reconstruya las situaciones experimentadas y extraiga conocimiento latente a través de cadenas de inferencia basadas en razonamiento en la red. Ante una consulta, Panini solo recorre el GSW que se actualiza continuamente (no los documentos textuales ni los fragmentos) y recupera las cadenas de inferencia más probables. En seis puntos de referencia de control de calidad, Panini logra el rendimiento promedio más alto, entre un 5 % y un 7 % más alto que otras líneas de base competitivas, mientras utiliza entre 2 y 30 veces menos tokens de contexto de respuesta, admite canalizaciones de código abierto y reduce las respuestas no respaldadas en consultas seleccionadas sin respuesta. Los resultados muestran que la estructuración eficiente y precisa de las experiencias en el momento de la escritura, como lo logra el marco GSW, produce ganancias tanto de eficiencia como de confiabilidad en el momento de la lectura. El código está disponible en esta URL https.

Publicado originalmente en export.arxiv.org el 17 de febrero de 2026.
Ver fuente original

admin

Aviso de privacidad

Súbete a la ola del IoT

Contacto

Please Share This Compartir este contenido

admin

También podría gustarte

Operai puede rehabilitar modelos de IA que desarrollan una “persona de chico malo”

Falsas alarmas, daño real: ataques adversos utilizando modelos basados ​​en LLM en sistemas de inteligencia de amenazas cibernéticas basadas en texto

Nueva heurística híbrida para la propagación pseudobooleana

Aviso de privacidad

test

Súbete a la ola del IoT

Contacto

Compartir este contenido

Falsas alarmas, daño real: ataques adversos utilizando modelos basados en LLM en sistemas de inteligencia de amenazas cibernéticas basadas en texto