Nemotron-Math: destilación eficiente de razonamiento matemático en contexto largo a partir de supervisión multimodo

Resumen:El conjunto de datos integra 85.000 problemas AoPS seleccionados con 262.000 problemas StackExchange-Math de origen comunitario, combinando tareas de competencia estructuradas con diversas consultas matemáticas del mundo real. Realizamos evaluaciones controladas para evaluar la calidad del conjunto de datos.
Nemotron-Math supera consistentemente al OpenMathReasoning original en problemas AoPS coincidentes. La incorporación de StackExchange-Math mejora sustancialmente la solidez y la generalización, especialmente en HLE-Math, al tiempo que preserva la precisión en los puntos de referencia de la competencia matemática.
Para respaldar una capacitación eficiente en contextos prolongados, desarrollamos una estrategia secuencial agrupada que acelera el ajuste fino de la longitud del contexto de 128 KB entre 2 y 3 $times$ sin una pérdida significativa de precisión. En general, Nemotron-Math permite un rendimiento de última generación, incluida una precisión del 100% maj@16 en AIME 2024 y 2025 con Python TIR.

Publicado originalmente en export.arxiv.org el 18 de diciembre de 2025.
Ver fuente original

admin

Aviso de privacidad

Súbete a la ola del IoT

Contacto

Please Share This Compartir este contenido

admin

También podría gustarte

Reina Roja digital: Evolución del programa adversario en Core War con LLM

Chatbot para ayudar a los pacientes a comprender su salud

Por qué la carrera con fines de lucro hacia la geoingeniería solar es mala para la ciencia y la confianza del público

Aviso de privacidad

test

Súbete a la ola del IoT

Contacto

Compartir este contenido