Hable libremente, ejecute estrictamente: IA agente basada en esquemas para flujos de trabajo científicos flexibles y reproducibles

Resumen: Operativizamos los 2 requisitos como determinismo de ejecución (ED) y flexibilidad conversacional (CF), y utilizamos estos ejes para revisar 20 sistemas que abarcan 5 grupos arquitectónicos a lo largo de un espectro de alcance de validación. Las puntuaciones se asignan mediante un protocolo multimodelo (15 sesiones independientes en 3 familias de LLM), lo que produce un acuerdo entre modelos sustancial o casi perfecto (Krippendorff a=0,80 para ED y a=0,98 para CF), lo que demuestra que la puntuación de LLM multimodelo puede servir como una alternativa reutilizable a los paneles de expertos humanos para la evaluación arquitectónica.
El panorama resultante revela un frente empírico de Pareto (ningún sistema revisado logra al mismo tiempo una alta flexibilidad y un alto determinismo), pero emerge una zona de convergencia entre los extremos generativo y centrado en el flujo de trabajo. Argumentamos que una arquitectura controlada por esquemas, que separa la autoridad conversacional de la de ejecución, está posicionada para desacoplar esta compensación y destilar tres principios operativos (aclaración antes de la ejecución, orquestación restringida de plan-acto y conexión de herramienta a nivel de flujo de trabajo) para guiar la adopción.

Publicado originalmente en export.arxiv.org el 8 de marzo de 2026.
Ver fuente original

admin

Aviso de privacidad

Súbete a la ola del IoT

Contacto

Please Share This Compartir este contenido

admin

También podría gustarte

Ubiqtree: cuantificación de incertidumbre en xai con conjuntos de árboles

Análisis teórico de la información de modelos mundiales en maximizadores de recompensa óptimos.

DASATHCO: Optimización de combinaciones de heurísticas de SAT de datos ADATIVAS a través de modelos de idiomas grandes

Aviso de privacidad

test

Súbete a la ola del IoT

Contacto

Compartir este contenido