Resumen: Grandes modelos de idiomas (LLM) tienen educadores y aprendices virtuales avanzados, unir PNL con AI4Education. El trabajo existente a menudo carece de escalabilidad y no puede aprovechar el contenido diverso del curso a gran escala, con marcos limitados para evaluar la calidad pedagógica. Con este fin, proponemos wikihowagent, un flujo de trabajo de múltiples agentes que aprovecha las LLM para simular conversaciones interactivas de aprendizaje de enseñanza. Integra agentes de maestros y alumnos, un gerente de interacción y un evaluador para facilitar el aprendizaje de procedimiento y evaluar la calidad pedagógica. Presentamos un conjunto de datos de 114,296 conversaciones de maestro-aprendizaje basado en 14,287 tutoriales en 17 dominios y 727 temas. Nuestro protocolo de evaluación combina métricas computacionales y basadas en rúbricas con alineación del juicio humano. Los resultados demuestran la efectividad del flujo de trabajo en diversas configuraciones, ofreciendo información sobre las capacidades de LLM en todos los dominios. Nuestros conjuntos de datos e implementaciones son totalmente de código abierto.
Publicado Originalme en export.arxiv.org El 8 de julio de 2025.
Ver Fuente Original