Un marco colaborativo de múltiples funciones y evolución automática con orientación de dificultad detallada para la generación de problemas matemáticos innovadores

Resumen:La generación de problemas matemáticos (MPG) es una dirección de investigación importante en el campo de la educación inteligente. En los últimos años, el rápido desarrollo de grandes modelos de lenguaje (LLM) ha permitido nuevos enfoques tecnológicos para las tareas de generación de problemas. Aunque los LLM existentes pueden lograr altos índices de corrección, generalmente carecen de innovación y exhiben una discriminación deficiente. En este artículo, proponemos la tarea de generación de problemas matemáticos innovadores (IMPG). Para resolver la tarea IMPG, este artículo propone un marco colaborativo de múltiples funciones y autoevolutivo con orientación detallada sobre las dificultades. Primero, se construye un mecanismo colaborativo de múltiples funciones que comprende un muestreador, un generador, un evaluador, una máquina de estados y una memoria, asegurando la corrección de los problemas generados a través de una optimización iterativa informada por la autoevaluación y la retroalimentación externa. En segundo lugar, presentamos un modelo de dificultad mejorado para cuantificar la dificultad y proporcionar orientación detallada. Adoptamos el algoritmo de muestreo de ruta guiado por asociación (DAPS) basado en datos para mejorar la racionalidad semántica de las codificaciones muestreadas. En tercer lugar, construimos el conjunto de datos HSM3K-CN, que comprende problemas matemáticos de secundaria de alta calidad. Se adopta un proceso de capacitación de múltiples etapas, que incorpora capacitación previa continua (CPT), ajuste fino supervisado (SFT) y optimización de políticas relativas al grupo (GRPO), para mejorar las capacidades de generación y evaluación del modelo base. Finalmente, la autoevolución del sistema se logra transfiriendo capacidades de evaluación del modelo experto al modelo de aprendiz mediante destilación. Los experimentos muestran que, en comparación con los modelos de referencia, nuestro método propuesto mejora significativamente la innovación de los problemas generados manteniendo una alta tasa de corrección.

Publicado originalmente en export.arxiv.org el 20 de enero de 2026.
Ver fuente original

admin

Aviso de privacidad

Súbete a la ola del IoT

Contacto

Please Share This Compartir este contenido

admin

También podría gustarte

Deformador: acoplamiento patrones localizados deformados con un contexto global para un robusto reconocimiento de voz de extremo a extremo

Marco de modelos de lenguaje grande multimodal para EV seguros e interpretables integrados

Linux Foundation anuncia el Proyecto de Administrador de paquetes justos para la estabilidad del sistema de gestión de contenido de código abierto

Aviso de privacidad

test

Súbete a la ola del IoT

Contacto

Compartir este contenido