En este momento estás viendo 
<span class="bsf-rt-reading-time"><span class="bsf-rt-display-label" prefix="Tiempo de lectura"></span> <span class="bsf-rt-display-time" reading_time="1"></span> <span class="bsf-rt-display-postfix" postfix="mins"></span></span><!-- .bsf-rt-reading-time -->Planificación personalizada de la ruta de aprendizaje con modelado del estado del alumno basado en objetivos

Planificación personalizada de la ruta de aprendizaje con modelado del estado del alumno basado en objetivos

  • Autor de la entrada:
  • Categoría de la entrada:Noticias externas

Resumen: La planificación personalizada de rutas de aprendizaje (PLPP) tiene como objetivo diseñar rutas de aprendizaje adaptativas que se alineen con los objetivos individuales. Si bien los modelos de lenguajes grandes (LLM) muestran potencial para personalizar las experiencias de aprendizaje, los enfoques existentes a menudo carecen de mecanismos para una planificación alineada con objetivos. Presentamos Pxplore, un marco novedoso para PLPP que integra un paradigma de capacitación basado en refuerzo y una arquitectura educativa impulsada por LLM. Diseñamos un modelo estructurado de estado del alumno y una función de recompensa automatizada que transforma objetivos abstractos en señales computables. Entrenamos la política combinando el ajuste supervisado (SFT) y la optimización de políticas relativas al grupo (GRPO), y la implementamos dentro de una plataforma de aprendizaje del mundo real. Amplios experimentos validan la eficacia de Pxplore a la hora de producir rutas de aprendizaje coherentes, personalizadas y basadas en objetivos. Publicamos nuestro código y conjunto de datos para facilitar futuras investigaciones.

Publicado originalmente en export.arxiv.org el 15 de octubre de 2025.
Ver fuente original

admin

Usuario de administración del sitio web