Resumen:La generación aumentada de recuperación (RAG) integra los LLM con fuentes externas, ofreciendo capacidades avanzadas para el acceso a la información y la toma de decisiones. Sin embargo, las contradicciones en la evidencia recuperada pueden generar resultados inconsistentes o poco confiables, lo cual es especialmente problemático en entornos empresariales donde el cumplimiento, la gobernanza y la rendición de cuentas son críticos. Los puntos de referencia existentes para la detección de contradicciones se limitan al análisis a nivel de oraciones y no capturan la complejidad de los documentos empresariales, como contratos, presentaciones financieras, informes de cumplimiento o manuales de políticas. Para abordar esta limitación, proponemos ContraGen, un marco de referencia consciente de las contradicciones adaptado al dominio empresarial. El marco genera documentos sintéticos de estilo empresarial con contradicciones incorporadas, lo que permite una evaluación sistemática de la coherencia tanto dentro como entre documentos. La minería de contradicciones automatizada se combina con la validación humana en el circuito para garantizar una alta precisión. Nuestras contribuciones incluyen generar documentos empresariales realistas, modelar una taxonomía de tipos de contradicciones comunes en los procesos de negocios, permitir la creación controlada de contradicciones propias y de pares, desarrollar un proceso de evaluación de recuperación consciente de las contradicciones e incorporar la supervisión humana para reflejar la complejidad del juicio en un dominio específico. Este trabajo establece una base para sistemas RAG más confiables y responsables en aplicaciones empresariales de búsqueda de información, donde detectar y resolver contradicciones es esencial para reducir el riesgo y garantizar el cumplimiento.
Publicado Originalme en export.arxiv.org El 6 de octubre de 2025.
Ver Fuente Original