Educación conversacional a escala: un flujo de trabajo de agente de múltiples LLM para el aprendizaje procesal y la evaluación de calidad pedagógica

Resumen: Grandes modelos de idiomas (LLM) tienen educadores y aprendices virtuales avanzados, unir PNL con AI4Education. El trabajo existente a menudo carece de escalabilidad y no puede aprovechar el contenido diverso del curso a gran escala, con marcos limitados para evaluar la calidad pedagógica. Con este fin, proponemos wikihowagent, un flujo de trabajo de múltiples agentes que aprovecha las LLM para simular conversaciones interactivas de aprendizaje de enseñanza. Integra agentes de maestros y alumnos, un gerente de interacción y un evaluador para facilitar el aprendizaje de procedimiento y evaluar la calidad pedagógica. Presentamos un conjunto de datos de 114,296 conversaciones de maestro-aprendizaje basado en 14,287 tutoriales en 17 dominios y 727 temas. Nuestro protocolo de evaluación combina métricas computacionales y basadas en rúbricas con alineación del juicio humano. Los resultados demuestran la efectividad del flujo de trabajo en diversas configuraciones, ofreciendo información sobre las capacidades de LLM en todos los dominios. Nuestros conjuntos de datos e implementaciones son totalmente de código abierto.

Publicado Originalme en export.arxiv.org El 8 de julio de 2025.
Ver Fuente Original

admin

Aviso de privacidad

Súbete a la ola del IoT

Contacto

Please Share This Compartir este contenido

admin

También podría gustarte

Exploración de las debilidades en los modelos de llamadas de funciones mediante el aprendizaje por refuerzo: un enfoque de aumento de datos contradictorios

TripScore: evaluación comparativa y recompensa de la planificación de viajes en el mundo real con una evaluación detallada

Planificación categórica difusa: satisfacción autónoma de objetivos con restricciones semánticas graduadas

Aviso de privacidad

test

Súbete a la ola del IoT

Contacto

Compartir este contenido