En este momento estás viendo 
<span class="bsf-rt-reading-time"><span class="bsf-rt-display-label" prefix="Tiempo de lectura"></span> <span class="bsf-rt-display-time" reading_time="1"></span> <span class="bsf-rt-display-postfix" postfix="mins"></span></span><!-- .bsf-rt-reading-time -->Adjudicador: Corrección de etiquetas ruidosas con un consejo de agentes de LLM informado por KG

Adjudicador: Corrección de etiquetas ruidosas con un consejo de agentes de LLM informado por KG

  • Autor de la entrada:
  • Categoría de la entrada:Noticias externas

Resumen:El rendimiento de los sistemas de aprendizaje automático de producción está fundamentalmente limitado por la calidad de sus datos de entrenamiento. En aplicaciones industriales de alto riesgo, las etiquetas ruidosas pueden degradar el rendimiento y erosionar la confianza del usuario. Este documento presenta Adjudicator, un sistema que aborda el desafío crítico de la minería de datos de identificar y corregir automáticamente el ruido de las etiquetas y ha sido validado para su implementación en producción. El juez modela esto como una tarea neurosimbólica, primero construyendo un gráfico de conocimiento (KG) dinámico para unificar el contexto del ítem. Este KG luego informa a un “Consejo de Agentes”, una novedosa arquitectura de Modelo de Lenguaje Grande multiagente donde agentes especializados debaten y votan sobre la validez de una etiqueta. Validamos nuestro sistema en un subconjunto equilibrado de 1000 elementos del punto de referencia AlleNoise. Nuestro modelo basado en KG logra una puntuación F1 de 0,99, superando significativamente a una línea base de LLM único (0,48 F1) y a un consejo que no pertenece a KG (0,59 F1). Nuestro análisis revela que esto se debe a una precisión, lograda mediante una novedosa lógica de anulación que utiliza el KG para identificar perfectamente errores estructurales complejos (recuperación completa), una clase de errores que las líneas base no logran encontrar. Este resultado demuestra un sistema robusto y explicable para la verificación de datos automatizada y de alta precisión, que sirve como prueba de concepto vital para generar conjuntos de datos valiosos en entornos industriales estrictamente gobernados.

Publicado originalmente en export.arxiv.org el 16 de diciembre de 2025.
Ver fuente original

admin

Usuario de administración del sitio web