Resumen:Este informe técnico describe AIA Forecaster, un sistema basado en Large Language Model (LLM) para pronósticos basados en datos no estructurados. El enfoque de AIA Forecaster combina tres elementos centrales: búsqueda agencial en fuentes de noticias de alta calidad, un agente supervisor que concilia pronósticos dispares para el mismo evento y un conjunto de técnicas de calibración estadística para contrarrestar sesgos de comportamiento en grandes modelos lingüísticos. En el punto de referencia ForecastBench (Karger et al., 2024), AIA Forecaster logra un rendimiento igual al de los superpronosticadores humanos, superando las líneas de base anteriores de LLM. Además de informar en ForecastBench, también presentamos un punto de referencia de pronóstico más desafiante procedente de mercados de predicción líquidos. Si bien el AIA Forecaster tiene un desempeño inferior al consenso del mercado en este punto de referencia, un conjunto que combina AIA Forecaster con el consenso del mercado supera al consenso por sí solo, lo que demuestra que nuestro pronosticador proporciona información aditiva. Nuestro trabajo establece un nuevo estado del arte en pronósticos de IA y proporciona recomendaciones prácticas y transferibles para futuras investigaciones. Hasta donde sabemos, este es el primer trabajo que logra de manera verificable pronósticos a nivel de expertos a escala.
Publicado originalmente en export.arxiv.org el 11 de noviembre de 2025.
Ver fuente original
