¿Qué persona nos falta? Identificación de personas relevantes desconocidas para la simulación de usuarios fieles

Resumen: Las simulaciones de usuarios existentes, donde los modelos generan respuestas similares a las de los usuarios en el diálogo, a menudo carecen de verificación de que se proporcionen suficientes personajes de usuario, lo que cuestiona la validez de las simulaciones.

Leer más →

Comentarios desactivados en ¿Qué persona nos falta? Identificación de personas relevantes desconocidas para la simulación de usuarios fieles

¿Qué tan incierta es la calificación? Un punto de referencia de métricas de incertidumbre para la evaluación automática basada en LLM

Resumen:El rápido aumento de los grandes modelos lingüísticos (LLM) está remodelando el panorama de la evaluación automática en la educación.

Leer más →

Comentarios desactivados en ¿Qué tan incierta es la calificación? Un punto de referencia de métricas de incertidumbre para la evaluación automática basada en LLM

Hacia una ciencia de la confiabilidad de los agentes de IA

Resumen: Los agentes de IA se utilizan cada vez más para ejecutar tareas importantes. Si bien el aumento de las puntuaciones de precisión en los puntos de referencia estándar sugiere un progreso rápido, muchos agentes siguen fallando en la práctica.

Leer más →

Comentarios desactivados en Hacia una ciencia de la confiabilidad de los agentes de IA

Fin del contenido

No hay más páginas por cargar