Resumen: Table Question Answering (TableQA) permite la interacción del lenguaje natural con datos tabulares estructurados. Sin embargo, los enfoques existentes de modelos de lenguaje grande (LLM) enfrentan limitaciones críticas: limitaciones de longitud del contexto que restringen las capacidades de manejo de datos, problemas de alucinaciones que comprometen la confiabilidad de las respuestas y arquitecturas de agente único que luchan con escenarios de razonamiento complejos que involucran relaciones semánticas y lógica de múltiples saltos. Este artículo presenta DataFactory, un marco de múltiples agentes que aborda estas limitaciones mediante la coordinación de equipos especializados y la transformación automatizada del conocimiento. El marco comprende un líder de datos que emplea el paradigma ReAct para la orquestación del razonamiento, junto con equipos dedicados de bases de datos y gráficos de conocimiento, lo que permite la descomposición sistemática de consultas complejas en tareas de razonamiento estructuradas y relacionales. Formalizamos la transformación automatizada de gráficos de datos a conocimiento a través de la función de mapeo T:D x S x R -> G, e implementamos consultas basadas en lenguaje natural que, a diferencia de los sistemas multiagente de flujo de trabajo fijo, permiten una deliberación flexible entre agentes y una planificación adaptativa para mejorar la solidez de la coordinación. También aplicamos estrategias de ingeniería contextual que integran patrones históricos y conocimiento del dominio para reducir las alucinaciones y mejorar la precisión de las consultas. En TabFact, WikiTableQuestions y FeTaQA, utilizando ocho LLM de cinco proveedores, los resultados muestran ganancias consistentes. Nuestro enfoque mejora la precisión en un 20,2 % (TabFact) y un 23,9 % (WikiTQ) con respecto a los valores iniciales, con efectos significativos (Cohen’s d > 1). La coordinación de equipos también supera a las variantes de un solo equipo (+5,5 % TabFact, +14,4 % WikiTQ, +17,1 % FeTaQA ROUGE-2). El marco ofrece pautas de diseño para la colaboración entre múltiples agentes y una plataforma práctica para el análisis de datos empresariales a través de consultas estructuradas integradas y representación del conocimiento basada en gráficos.
Publicado originalmente en export.arxiv.org el 10 de marzo de 2026.
Ver fuente original
