Resumen:La generación de problemas matemáticos (MPG) es una dirección de investigación importante en el campo de la educación inteligente. En los últimos años, el rápido desarrollo de grandes modelos de lenguaje (LLM) ha permitido nuevos enfoques tecnológicos para las tareas de generación de problemas. Aunque los LLM existentes pueden lograr altos índices de corrección, generalmente carecen de innovación y exhiben una discriminación deficiente. En este artículo, proponemos la tarea de generación de problemas matemáticos innovadores (IMPG). Para resolver la tarea IMPG, este artículo propone un marco colaborativo de múltiples funciones y autoevolutivo con orientación detallada sobre las dificultades. Primero, se construye un mecanismo colaborativo de múltiples funciones que comprende un muestreador, un generador, un evaluador, una máquina de estados y una memoria, asegurando la corrección de los problemas generados a través de una optimización iterativa informada por la autoevaluación y la retroalimentación externa. En segundo lugar, presentamos un modelo de dificultad mejorado para cuantificar la dificultad y proporcionar orientación detallada. Adoptamos el algoritmo de muestreo de ruta guiado por asociación (DAPS) basado en datos para mejorar la racionalidad semántica de las codificaciones muestreadas. En tercer lugar, construimos el conjunto de datos HSM3K-CN, que comprende problemas matemáticos de secundaria de alta calidad. Se adopta un proceso de capacitación de múltiples etapas, que incorpora capacitación previa continua (CPT), ajuste fino supervisado (SFT) y optimización de políticas relativas al grupo (GRPO), para mejorar las capacidades de generación y evaluación del modelo base. Finalmente, la autoevolución del sistema se logra transfiriendo capacidades de evaluación del modelo experto al modelo de aprendiz mediante destilación. Los experimentos muestran que, en comparación con los modelos de referencia, nuestro método propuesto mejora significativamente la innovación de los problemas generados manteniendo una alta tasa de corrección.
Publicado originalmente en export.arxiv.org el 20 de enero de 2026.
Ver fuente original
