En este momento estás viendo 
<span class="bsf-rt-reading-time"><span class="bsf-rt-display-label" prefix="Tiempo de lectura"></span> <span class="bsf-rt-display-time" reading_time="2"></span> <span class="bsf-rt-display-postfix" postfix="mins"></span></span><!-- .bsf-rt-reading-time -->PublicAgent: principios de diseño de agentes múltiples a partir de un marco de análisis de datos abiertos basado en LLM

PublicAgent: principios de diseño de agentes múltiples a partir de un marco de análisis de datos abiertos basado en LLM

  • Autor de la entrada:
  • Categoría de la entrada:Noticias externas

Resumen: Los repositorios de datos abiertos tienen potencial para la toma de decisiones basada en evidencia, pero son inaccesibles para los no expertos que carecen de experiencia en descubrimiento de conjuntos de datos, mapeo de esquemas y análisis estadístico. Los grandes modelos de lenguaje son prometedores para tareas individuales, pero los flujos de trabajo analíticos de un extremo a otro exponen limitaciones fundamentales: la atención se diluye en contextos en crecimiento, los patrones de razonamiento especializados interfieren y los errores se propagan sin ser detectados. Presentamos PublicAgent, un marco de múltiples agentes que aborda estas limitaciones mediante la descomposición en agentes especializados para aclarar intenciones, descubrir conjuntos de datos, analizar y generar informes. Esta arquitectura mantiene la atención enfocada dentro de los contextos de los agentes y permite la validación en cada etapa. La evaluación de cinco modelos y 50 consultas deriva cinco principios de diseño para sistemas LLM de múltiples agentes. En primer lugar, la especialización proporciona valor independientemente de la solidez del modelo: incluso el modelo más sólido muestra tasas de ganancia de agentes del 97,5%, con beneficios ortogonales a la escala del modelo. En segundo lugar, los agentes se dividen en categorías universales (descubrimiento, análisis) y condicionales (informe, intención). Los agentes universales muestran una eficacia constante (desarrollo estándar 12,4%), mientras que los agentes condicionales varían según el modelo (desarrollo estándar 20,5%). En tercer lugar, los agentes mitigan distintos modos de falla: eliminar el descubrimiento o el análisis provoca fallas catastróficas (243-280 casos), mientras que eliminar el informe o la intención causa una degradación de la calidad. En cuarto lugar, los beneficios arquitectónicos persisten en toda la complejidad de las tareas con tasas de éxito estables (86-92 % de análisis, 84-94 % de descubrimiento), lo que indica un valor de gestión del flujo de trabajo en lugar de una mejora del razonamiento. En quinto lugar, la amplia variación en la efectividad de los agentes entre los modelos (42-96% para el análisis) requiere un diseño de arquitectura consciente del modelo. Estos principios guían cuándo y por qué es necesaria la especialización para flujos de trabajo analíticos complejos y, al mismo tiempo, permiten un acceso más amplio a los datos públicos a través de interfaces de lenguaje natural.

Publicado originalmente en export.arxiv.org el 5 de noviembre de 2025.
Ver fuente original

admin

Usuario de administración del sitio web