Resumen: Los agentes de modelos de lenguaje grande (LLM) tienen cada vez más tareas con análisis complejos del mundo real (por ejemplo, en pronósticos financieros, descubrimientos científicos), sin embargo, su razonamiento adolece de inestabilidad estocástica y carece de una estructura compositiva verificable. Para abordar esto, presentamos Analytica, una nueva arquitectura de agentes basada en el principio de razonamiento proposicional suave (SPR). SPR reformula el análisis complejo como un proceso estructurado de estimación de los valores de verdad suaves de diferentes proposiciones de resultados, lo que nos permite modelar formalmente y minimizar el error de estimación en términos de su sesgo y varianza. Analytica pone esto en práctica a través de un marco paralelo de divide y vencerás que reduce sistemáticamente ambas fuentes de error. Para reducir el sesgo, los problemas se descomponen primero en un árbol de subproposiciones y se emplean agentes básicos de LLM equipados con herramientas, incluido un novedoso agente Jupyter Notebook para análisis basado en datos, que ayuda a validar y calificar los hechos. Para reducir la varianza, Analytica sintetiza recursivamente estas hojas conectadas a tierra utilizando modelos lineales robustos que promedian el ruido estocástico con eficiencia y escalabilidad superiores y permiten el análisis interactivo de escenarios hipotéticos. Nuestros resultados teóricos y empíricos sobre tareas de pronóstico económico, financiero y político muestran que Analytica mejora un 15,84% de precisión en promedio en diversos modelos base, logrando un 71,06% de precisión con la variación más baja de 6,02% cuando se trabaja con un terreno de investigación profunda. Nuestro Jupyter Notebook Grounder muestra una gran rentabilidad que logra una precisión cercana al 70,11 % con un 90,35 % menos de costo y un 52,85 % menos de tiempo. Analytica también muestra un crecimiento de rendimiento estable y altamente resistente al ruido a medida que aumenta la profundidad del análisis, con una complejidad temporal casi lineal, así como una buena adaptabilidad a los dominios científicos y LLM de peso abierto.
Publicado originalmente en export.arxiv.org el 27 de abril de 2026.
Ver fuente original
