Resumen: El razonamiento financiero efectivo exige no solo la comprensión textual sino también la capacidad de interpretar datos visuales complejos como gráficos, tablas y gráficos de tendencias. Este documento presenta un nuevo punto de referencia diseñado para evaluar qué tan bien modelos de IA, especialmente modelos de lenguaje grande y multimodal, razón en contextos específicos de finanzas. Cubriendo 3.200 pares de respuesta a nivel de experto en 15 temas financieros centrales, el punto de referencia integra modalidades textuales y visuales para reflejar desafíos analíticos auténticos en las finanzas. Para abordar las limitaciones en los enfoques de razonamiento actuales, proponemos un marco de aprendizaje consciente de errores que aprovecha los errores del modelo histórico y la retroalimentación para guiar la inferencia, sin requerir el ajuste fino. Nuestros experimentos en modelos de vanguardia muestran que las entradas multimodales mejoran significativamente el rendimiento y que la incorporación de retroalimentación de errores conduce a mejoras consistentes y medibles. Los resultados resaltan desafíos persistentes en la comprensión visual y la lógica matemática, al tiempo que demuestran la promesa de razonamiento autorreflexivo en los sistemas de IA financieros. Nuestro código y datos se pueden encontrar en https: // anónimo/finmr/codedata.
Publicado Originalme en rss.arxiv.org El 9 de junio de 2025.
Ver Fuente Original