Resumen: El aprendizaje en contexto (ICL) ha demostrado ser muy eficaz en diversas tareas de modelos de lenguaje grande (LLM). Sin embargo, su potencial para mejorar tareas que exigen una deducción lógica paso a paso, como el razonamiento matemático, sigue sin explorarse. Una limitación central de los enfoques ICL existentes es su uso estático de demostraciones: los ejemplos se preseleccionan antes de la inferencia y permanecen fijos, sin adaptarse a los puntos de confusión dinámicos que a menudo surgen durante el razonamiento de varios pasos, como cálculos ambiguos o lagunas lógicas. Estos puntos de confusión no resueltos pueden provocar errores en cascada que degradan la precisión final. Para abordar este problema, proponemos Process In-Context Learning (PICL), un marco de integración de demostración dinámica diseñado para impulsar el razonamiento matemático respondiendo a las necesidades de inferencia en tiempo real. PICL opera en dos etapas: 1) ~identifica posibles puntos de confusión mediante el análisis de la semántica y la entropía en el proceso de razonamiento y resume sus características centrales; 2)~al encontrar estos puntos, recupera demostraciones relevantes del conjunto de demostraciones que coinciden con el contexto de confusión y las inserta directamente en el proceso de razonamiento en curso para guiar los pasos posteriores. Los experimentos muestran que PICL supera a los métodos de referencia al mitigar la confusión a mitad de la inferencia, destacando el valor de la inserción de demostración adaptativa en el razonamiento matemático complejo.
Publicado originalmente en export.arxiv.org el 20 de enero de 2026.
Ver fuente original
