Modelo de fusión para la edición de conocimiento

Resumen: Los modelos de idiomas grandes (LLM) requieren actualizaciones continuas para mantener el conocimiento preciso y actual a medida que el mundo evoluciona. Si bien los enfoques de edición de conocimiento existentes ofrecen varias soluciones para la actualización del conocimiento, a menudo luchan con escenarios de edición secuenciales y dañan las capacidades generales del modelo, lo que obstaculiza significativamente su aplicabilidad práctica. Este documento propone un marco de dos etapas que combina un ajuste fino supervisado (R-SFT) sólido con fusión del modelo para la edición del conocimiento. Nuestro método primero ajusta el LLM para internalizar completamente los nuevos conocimientos, luego fusiona el modelo ajustado con el modelo de base original para preservar el conocimiento recién adquirido y las capacidades generales. Los resultados experimentales demuestran que nuestro enfoque supera significativamente los métodos existentes en la edición secuencial al tiempo que preserva el rendimiento original del modelo, todo sin requerir ningún cambio arquitectónico. El código está disponible en: esta URL HTTPS.

Publicado Originalme en rss.arxiv.org El 16 de junio de 2025.
Ver Fuente Original

admin

Aviso de privacidad

Súbete a la ola del IoT

Contacto

Please Share This Compartir este contenido

admin

También podría gustarte

CONFIANZA: un marco descentralizado para auditar el razonamiento de modelos de lenguajes grandes

The Download: un nuevo hogar bajo el mar y clonación de mascotas

Entrevista a Gérald SANTUCCI – ENSA (Asociación Europea de la Nueva Sociedad de la Educación)

Aviso de privacidad

test

Súbete a la ola del IoT

Contacto

Compartir este contenido