PublicAgent: principios de diseño de agentes múltiples a partir de un marco de análisis de datos abiertos basado en LLM

Resumen: Los repositorios de datos abiertos tienen potencial para la toma de decisiones basada en evidencia, pero son inaccesibles para los no expertos que carecen de experiencia en descubrimiento de conjuntos de datos, mapeo de esquemas y análisis estadístico. Los grandes modelos de lenguaje son prometedores para tareas individuales, pero los flujos de trabajo analíticos de un extremo a otro exponen limitaciones fundamentales: la atención se diluye en contextos en crecimiento, los patrones de razonamiento especializados interfieren y los errores se propagan sin ser detectados. Presentamos PublicAgent, un marco de múltiples agentes que aborda estas limitaciones mediante la descomposición en agentes especializados para aclarar intenciones, descubrir conjuntos de datos, analizar y generar informes. Esta arquitectura mantiene la atención enfocada dentro de los contextos de los agentes y permite la validación en cada etapa. La evaluación de cinco modelos y 50 consultas deriva cinco principios de diseño para sistemas LLM de múltiples agentes. En primer lugar, la especialización proporciona valor independientemente de la solidez del modelo: incluso el modelo más sólido muestra tasas de ganancia de agentes del 97,5%, con beneficios ortogonales a la escala del modelo. En segundo lugar, los agentes se dividen en categorías universales (descubrimiento, análisis) y condicionales (informe, intención). Los agentes universales muestran una eficacia constante (desarrollo estándar 12,4%), mientras que los agentes condicionales varían según el modelo (desarrollo estándar 20,5%). En tercer lugar, los agentes mitigan distintos modos de falla: eliminar el descubrimiento o el análisis provoca fallas catastróficas (243-280 casos), mientras que eliminar el informe o la intención causa una degradación de la calidad. En cuarto lugar, los beneficios arquitectónicos persisten en toda la complejidad de las tareas con tasas de éxito estables (86-92 % de análisis, 84-94 % de descubrimiento), lo que indica un valor de gestión del flujo de trabajo en lugar de una mejora del razonamiento. En quinto lugar, la amplia variación en la efectividad de los agentes entre los modelos (42-96% para el análisis) requiere un diseño de arquitectura consciente del modelo. Estos principios guían cuándo y por qué es necesaria la especialización para flujos de trabajo analíticos complejos y, al mismo tiempo, permiten un acceso más amplio a los datos públicos a través de interfaces de lenguaje natural.

Publicado originalmente en export.arxiv.org el 5 de noviembre de 2025.
Ver fuente original

admin

Aviso de privacidad

Súbete a la ola del IoT

Contacto

Please Share This Compartir este contenido

admin

También podría gustarte

HealthSLM Bench: evaluación comparativa de modelos de lenguaje pequeño para monitoreo de atención médica móviles y portátiles

De las narrativas al razonamiento probabilístico: predecir e interpretar las acciones peligrosas de los conductores en accidentes utilizando un modelo de lenguaje grande

Dyna-pensamiento: sinergizando razonamiento, actuación y simulación de modelos mundiales en agentes de IA

Aviso de privacidad

test

Súbete a la ola del IoT

Contacto

Compartir este contenido