En este momento estás viendo 
<span class="bsf-rt-reading-time"><span class="bsf-rt-display-label" prefix="Tiempo de lectura"></span> <span class="bsf-rt-display-time" reading_time="1"></span> <span class="bsf-rt-display-postfix" postfix="mins"></span></span><!-- .bsf-rt-reading-time -->Fiabilidad por diseño: cuantificar y eliminar el riesgo de fabricación en LLM. De la IA generativa a la consultiva: un análisis comparativo en el ámbito jurídico y lecciones para bases de conocimiento de alto riesgo

Fiabilidad por diseño: cuantificar y eliminar el riesgo de fabricación en LLM. De la IA generativa a la consultiva: un análisis comparativo en el ámbito jurídico y lecciones para bases de conocimiento de alto riesgo

  • Autor de la entrada:
  • Categoría de la entrada:Noticias externas

Resumen:Este artículo examina cómo hacer que los modelos de lenguaje grandes sean confiables para el trabajo legal de alto riesgo mediante la reducción de las alucinaciones. Distingue tres paradigmas de IA: (1) modelos generativos independientes (“oráculo creativo”), (2) sistemas básicos de recuperación aumentada (“archivista experto”) y (3) un sistema RAG avanzado y optimizado de extremo a extremo (“archivista riguroso”). Los autores introducen dos métricas de confiabilidad: Tasa de citas falsas (FCR) y Tasa de hechos fabricados (FFR) – y evalúan 2.700 respuestas de estilo judicial de 12 LLM en 75 tareas legales mediante una revisión experta doble ciego. Los resultados muestran que los modelos independientes no son adecuados para uso profesional (FCR superior al 30%), mientras que el RAG básico reduce en gran medida los errores, pero aún deja una falta de conexión a tierra notable. El RAG avanzado, que utiliza técnicas como la incorporación de ajustes finos, reclasificación y autocorrección, reduce la fabricación a niveles insignificantes (por debajo del 0,2%). El estudio concluye que la IA legal confiable requiere arquitecturas basadas en la recuperación y centradas en el rigor que enfaticen la verificación y la trazabilidad, y proporciona un marco de evaluación aplicable a otros dominios de alto riesgo.

Publicado originalmente en export.arxiv.org el 22 de enero de 2026.
Ver fuente original

admin

Usuario de administración del sitio web