Resumen: La evaluación de la consistencia en modelos de lenguaje grande (LLMS) es crucial para garantizar la confiabilidad, particularmente en interacciones complejas de múltiples pasos entre humanos y LLM.
Leer más →
Resumen: Los agentes de aprendizaje de refuerzo profundo (DRL) a menudo exhiben modos de falla intrincados que son difíciles de entender, depurar y aprender. Esta opacidad obstaculiza su implementación confiable en aplicaciones del mundo real.
Leer más →
Resumen: Los sistemas de recuperación de documentos multimodales permiten el acceso a la información a través del texto, las imágenes y los diseños, beneficiando varios dominios como respuesta de preguntas basadas en documentos, análisis de informes y resumen de contenido interactivo. Los vuelos a los vuelos mejoran la precisión de la recuperación al reordenar a los candidatos recuperados.
Leer más →