En este momento estás viendo 
<span class="bsf-rt-reading-time"><span class="bsf-rt-display-label" prefix="Tiempo de lectura"></span> <span class="bsf-rt-display-time" reading_time="1"></span> <span class="bsf-rt-display-postfix" postfix="mins"></span></span><!-- .bsf-rt-reading-time -->AutoVerifier: un marco de verificación automatizado agente que utiliza modelos de lenguaje grandes

AutoVerifier: un marco de verificación automatizado agente que utiliza modelos de lenguaje grandes

  • Autor de la entrada:
  • Categoría de la entrada:Noticias externas

Resumen:El análisis de la Inteligencia Científica y Técnica (C&TI) requiere verificar afirmaciones técnicas complejas en una literatura en rápido crecimiento, donde los enfoques existentes no logran cerrar la brecha de verificación entre la precisión a nivel superficial y la validez metodológica más profunda. Presentamos AutoVerifier, un marco agente basado en LLM que automatiza la verificación de extremo a extremo de reclamos técnicos sin requerir experiencia en el dominio. AutoVerifier descompone cada afirmación técnica en triples de afirmaciones estructuradas de la forma (Sujeto, Predicado, Objeto), construyendo gráficos de conocimiento que permiten el razonamiento estructurado en seis capas progresivamente enriquecidas: construcción e ingesta de corpus, extracción de entidades y afirmaciones, verificación intradocumento, verificación de fuentes cruzadas, corroboración de señales externas y generación de matrices de hipótesis finales. Demostramos AutoVerifier en un reclamo impugnado sobre computación cuántica, donde el marco, operado por analistas sin experiencia cuántica, identificó automáticamente reclamos excesivos e inconsistencias métricas dentro del documento de destino, rastreó contradicciones entre fuentes, descubrió conflictos de intereses comerciales no revelados y produjo una evaluación final. Estos resultados muestran que la verificación estructurada de LLM puede evaluar de manera confiable la validez y madurez de las tecnologías emergentes, convirtiendo documentos técnicos en bruto en evaluaciones de inteligencia rastreables y respaldadas por evidencia.

Publicado originalmente en export.arxiv.org el 5 de abril de 2026.
Ver fuente original

admin

Usuario de administración del sitio web