Fiabilidad por diseño: cuantificar y eliminar el riesgo de fabricación en LLM. De la IA generativa a la consultiva: un análisis comparativo en el ámbito jurídico y lecciones para bases de conocimiento de alto riesgo

Resumen:Este artículo examina cómo hacer que los modelos de lenguaje grandes sean confiables para el trabajo legal de alto riesgo mediante la reducción de las alucinaciones. Distingue tres paradigmas de IA: (1) modelos generativos independientes (“oráculo creativo”), (2) sistemas básicos de recuperación aumentada (“archivista experto”) y (3) un sistema RAG avanzado y optimizado de extremo a extremo (“archivista riguroso”). Los autores introducen dos métricas de confiabilidad: Tasa de citas falsas (FCR) y Tasa de hechos fabricados (FFR) – y evalúan 2.700 respuestas de estilo judicial de 12 LLM en 75 tareas legales mediante una revisión experta doble ciego. Los resultados muestran que los modelos independientes no son adecuados para uso profesional (FCR superior al 30%), mientras que el RAG básico reduce en gran medida los errores, pero aún deja una falta de conexión a tierra notable. El RAG avanzado, que utiliza técnicas como la incorporación de ajustes finos, reclasificación y autocorrección, reduce la fabricación a niveles insignificantes (por debajo del 0,2%). El estudio concluye que la IA legal confiable requiere arquitecturas basadas en la recuperación y centradas en el rigor que enfaticen la verificación y la trazabilidad, y proporciona un marco de evaluación aplicable a otros dominios de alto riesgo.

Publicado originalmente en export.arxiv.org el 22 de enero de 2026.
Ver fuente original

admin

Aviso de privacidad

Súbete a la ola del IoT

Contacto

Please Share This Compartir este contenido

admin

También podría gustarte

ALCANCE: Evolución rápida para mejorar la eficacia del agente

La descarga: los estudios de clima de EE. UU. Se están cerrando y construyendo ciudades de lava

Las 88,000 casas nuevas de Londres al año están en riesgo a medida que los costos de construcción se disparan

Aviso de privacidad

test

Súbete a la ola del IoT

Contacto

Compartir este contenido