Resumen: Este documento presenta MathBode, un diagnóstico dinámico para el razonamiento matemático en modelos de idiomas grandes (LLM). En lugar de la precisión de un solo disparo, MathBode trata cada problema paramétrico como un sistema: impulsamos un solo parámetro sinusoidalmente y ajustamos las respuestas del primer armónicas de las salidas del modelo y las soluciones exactas. Esto produce métricas interpretables y resueltas con frecuencia (ganancia (seguimiento de amplitud) y fase (retraso)) que forman huellas digitales al estilo Bode. En cinco familias de forma cerrada (resolución lineal, relación/saturación, interés compuesto, sistemas lineales de 2×2, triángulos similares), el comportamiento de diagnóstico de bajo paso bajo y el retraso de fase de crecimiento que la precisión solo oscurece. Comparamos varios modelos con una línea de base simbólica que calibra el instrumento ($ g aprox 1 $, $ phi aprox 0 $). Los resultados separan la frontera de los modelos de nivel medio en dinámica, proporcionando un protocolo compacto y reproducible que complementa los puntos de referencia estándar con mediciones procesables de fidelidad y consistencia de razonamiento. De código abierto el conjunto de datos y el código para habilitar más investigaciones y adopción.
Publicado Originalme en export.arxiv.org El 29 de septiembre de 2025.
Ver Fuente Original
