Sesgo de atribución en modelos de lenguaje grandes

Resumen: A medida que los modelos de lenguaje grande (LLM) se utilizan cada vez más para respaldar la búsqueda y la recuperación de información, es fundamental que atribuyan con precisión el contenido a sus autores originales. En este trabajo, presentamos AttriBench, el primer conjunto de datos de referencia de atribución de cotizaciones equilibrado demográfica y de fama.

Leer más →

Comentarios desactivados en Sesgo de atribución en modelos de lenguaje grandes

ClawsBench: Evaluación de la capacidad y seguridad de los agentes de productividad LLM en espacios de trabajo simulados

Resumen: Los agentes de modelo de lenguaje grande (LLM) se implementan cada vez más para automatizar tareas de productividad (por ejemplo, correo electrónico, programación, gestión de documentos), pero evaluarlos en servicios en vivo es arriesgado debido a cambios potencialmente irreversibles.

Leer más →

Comentarios desactivados en ClawsBench: Evaluación de la capacidad y seguridad de los agentes de productividad LLM en espacios de trabajo simulados

Fin del contenido

No hay más páginas por cargar