En este momento estás viendo 
<span class="bsf-rt-reading-time"><span class="bsf-rt-display-label" prefix="Tiempo de lectura"></span> <span class="bsf-rt-display-time" reading_time="1"></span> <span class="bsf-rt-display-postfix" postfix="mins"></span></span><!-- .bsf-rt-reading-time -->Nemotron-Math: destilación eficiente de razonamiento matemático en contexto largo a partir de supervisión multimodo

Nemotron-Math: destilación eficiente de razonamiento matemático en contexto largo a partir de supervisión multimodo

  • Autor de la entrada:
  • Categoría de la entrada:Noticias externas

Resumen:El conjunto de datos integra 85.000 problemas AoPS seleccionados con 262.000 problemas StackExchange-Math de origen comunitario, combinando tareas de competencia estructuradas con diversas consultas matemáticas del mundo real. Realizamos evaluaciones controladas para evaluar la calidad del conjunto de datos.
Nemotron-Math supera consistentemente al OpenMathReasoning original en problemas AoPS coincidentes. La incorporación de StackExchange-Math mejora sustancialmente la solidez y la generalización, especialmente en HLE-Math, al tiempo que preserva la precisión en los puntos de referencia de la competencia matemática.
Para respaldar una capacitación eficiente en contextos prolongados, desarrollamos una estrategia secuencial agrupada que acelera el ajuste fino de la longitud del contexto de 128 KB entre 2 y 3 $times$ sin una pérdida significativa de precisión. En general, Nemotron-Math permite un rendimiento de última generación, incluida una precisión del 100% maj@16 en AIME 2024 y 2025 con Python TIR.

Publicado originalmente en export.arxiv.org el 18 de diciembre de 2025.
Ver fuente original

admin

Usuario de administración del sitio web