AutoVerifier: un marco de verificación automatizado agente que utiliza modelos de lenguaje grandes

Resumen:El análisis de la Inteligencia Científica y Técnica (C&TI) requiere verificar afirmaciones técnicas complejas en una literatura en rápido crecimiento, donde los enfoques existentes no logran cerrar la brecha de verificación entre la precisión a nivel superficial y la validez metodológica más profunda. Presentamos AutoVerifier, un marco agente basado en LLM que automatiza la verificación de extremo a extremo de reclamos técnicos sin requerir experiencia en el dominio. AutoVerifier descompone cada afirmación técnica en triples de afirmaciones estructuradas de la forma (Sujeto, Predicado, Objeto), construyendo gráficos de conocimiento que permiten el razonamiento estructurado en seis capas progresivamente enriquecidas: construcción e ingesta de corpus, extracción de entidades y afirmaciones, verificación intradocumento, verificación de fuentes cruzadas, corroboración de señales externas y generación de matrices de hipótesis finales. Demostramos AutoVerifier en un reclamo impugnado sobre computación cuántica, donde el marco, operado por analistas sin experiencia cuántica, identificó automáticamente reclamos excesivos e inconsistencias métricas dentro del documento de destino, rastreó contradicciones entre fuentes, descubrió conflictos de intereses comerciales no revelados y produjo una evaluación final. Estos resultados muestran que la verificación estructurada de LLM puede evaluar de manera confiable la validez y madurez de las tecnologías emergentes, convirtiendo documentos técnicos en bruto en evaluaciones de inteligencia rastreables y respaldadas por evidencia.

Publicado originalmente en export.arxiv.org el 5 de abril de 2026.
Ver fuente original

admin

Aviso de privacidad

Súbete a la ola del IoT

Contacto

Please Share This Compartir este contenido

admin

También podría gustarte

IA agente: un estudio completo de arquitecturas, aplicaciones y direcciones futuras

Epistemología bayesiana con autoridad ponderada: una arquitectura formal para el razonamiento científico autónomo que promueve la verdad

Mejora de las habilidades de razonamiento generalizado de LLM por problemas de gráficos

Aviso de privacidad

test

Súbete a la ola del IoT

Contacto

Compartir este contenido