Planificación personalizada de la ruta de aprendizaje con modelado del estado del alumno basado en objetivos

Resumen: La planificación personalizada de rutas de aprendizaje (PLPP) tiene como objetivo diseñar rutas de aprendizaje adaptativas que se alineen con los objetivos individuales. Si bien los modelos de lenguajes grandes (LLM) muestran potencial para personalizar las experiencias de aprendizaje, los enfoques existentes a menudo carecen de mecanismos para una planificación alineada con objetivos. Presentamos Pxplore, un marco novedoso para PLPP que integra un paradigma de capacitación basado en refuerzo y una arquitectura educativa impulsada por LLM. Diseñamos un modelo estructurado de estado del alumno y una función de recompensa automatizada que transforma objetivos abstractos en señales computables. Entrenamos la política combinando el ajuste supervisado (SFT) y la optimización de políticas relativas al grupo (GRPO), y la implementamos dentro de una plataforma de aprendizaje del mundo real. Amplios experimentos validan la eficacia de Pxplore a la hora de producir rutas de aprendizaje coherentes, personalizadas y basadas en objetivos. Publicamos nuestro código y conjunto de datos para facilitar futuras investigaciones.

Publicado originalmente en export.arxiv.org el 15 de octubre de 2025.
Ver fuente original

admin

Aviso de privacidad

Súbete a la ola del IoT

Contacto

Please Share This Compartir este contenido

admin

También podría gustarte

Artesanía: adaptación cultural de conjunto de datos ruso para la generación de texto a imagen enfocada

Holos: un sistema multiagente basado en LLM a escala web para la web agente

El razonamiento explícito hace mejores jueces: un estudio sistemático sobre precisión, eficiencia y robustez

Aviso de privacidad

test

Súbete a la ola del IoT

Contacto

Compartir este contenido