Resumen: Los avances recientes en grandes modelos de razonamiento (LRMS) muestran un fuerte rendimiento en dominios estructurados como las matemáticas y la programación; Sin embargo, a menudo carecen de coherencia pedagógica y comportamientos de enseñanza realistas. Para cerrar esta brecha, introducimos la pedagogía-R1, un marco que adapta los LRM para el uso del aula a través de tres innovaciones: (1) una tubería basada en la destilación que filtra y refina los resultados del modelo para el ajuste de las instrucciones, (2) el punto de referencia educativo bien equilibrado (WBEB), que evalúa el rendimiento de los cuentas en el conocimiento de la materia, el conocimiento pedagógico, el transporte (COP) Involucrar una estrategia para generar y provocar razonamiento estilo maestro. Nuestra evaluación de métodos mixtos combina métricas cuantitativas con análisis cualitativo, proporcionando la primera evaluación sistemática de las fortalezas y limitaciones pedagógicas de LRMS.
Publicado Originalme en rss.arxiv.org El 26 de mayo de 2025.
Ver Fuente Original