Resumen: Los modelos de lenguajes grandes a menudo luchan con tareas analíticas complejas de largo plazo en tablas no estructuradas, que generalmente presentan encabezados jerárquicos y bidireccionales y diseños no canónicos. Formalizamos este desafío como Investigación Tabular Profunda (DTR), que requiere un razonamiento de varios pasos sobre regiones de tablas interdependientes. Para abordar la DTR, proponemos un marco agente novedoso que trata el razonamiento tabular como un proceso de toma de decisiones de circuito cerrado. Diseñamos cuidadosamente una consulta acoplada y comprensión de tablas para la toma de decisiones de ruta y la ejecución operativa. Específicamente, (i) DTR primero construye un metagráfico jerárquico para capturar la semántica bidireccional, mapeando consultas de lenguaje natural en un espacio de búsqueda a nivel de operación; (ii) Para navegar por este espacio, introducimos una política de selección consciente de las expectativas que prioriza rutas de ejecución de alta utilidad; (iii) Fundamentalmente, los resultados de la ejecución histórica se sintetizan en una memoria estructurada siamesa, es decir, actualizaciones parametrizadas y textos resumidos, lo que permite un refinamiento continuo. Amplios experimentos sobre desafiantes puntos de referencia tabulares no estructurados verifican la efectividad y resaltan la necesidad de separar la planificación estratégica de la ejecución de bajo nivel para el razonamiento tabular a largo plazo.
Publicado originalmente en export.arxiv.org el 10 de marzo de 2026.
Ver fuente original
