CONFIANZA: un marco descentralizado para auditar el razonamiento de modelos de lenguajes grandes
Resumen: Los grandes modelos de lenguaje generan cadenas de razonamiento complejas que revelan su toma de decisiones; sin embargo, verificar la fidelidad e inocuidad de estos pasos intermedios sigue siendo un problema crítico sin resolver.
Leer más →