Resumen: Los modelos de aprendizaje profundo destacan en la detección de patrones anómalos en datos normales. Sin embargo, no proporcionan una solución directa para la clasificación de anomalías y la escalabilidad en diversos sistemas de control, y con frecuencia no logran distinguir las fallas genuinas de las molestas causadas por el ruido o la gran respuesta transitoria del sistema de control. En consecuencia, debido a que la validación algorítmica de fallas sigue siendo no escalable, las operaciones completas de verificación y validación (V&V) aún se administran mediante el análisis Human-in-the-Loop (HITL), lo que resulta en una carga de trabajo manual insostenible. Para automatizar esta supervisión esencial, proponemos la verificación y validación integradas por agentes (AIVV), un marco híbrido que implementa modelos de lenguajes grandes (LLM) como un bucle externo deliberativo. Debido a que la verificación rigurosa del sistema depende estrictamente de una validación precisa, la AIVV eleva las anomalías marcadas matemáticamente a un consejo de LLM especializado en funciones. Los agentes del consejo realizan una validación colaborativa validando semánticamente las molestias y las fallas verdaderas en función de los requisitos del lenguaje natural (NL) para asegurar una línea base de verificación del sistema de alta fidelidad. Sobre la base de esta base, el consejo luego realiza la verificación del sistema evaluando las respuestas posteriores a la falla frente a las tolerancias operativas de NL y, en última instancia, genera artefactos V&V procesables, como propuestas de ajuste de ganancia. Los experimentos en un simulador de series de tiempo para vehículos submarinos no tripulados (UUV) demuestran que AIVV digitaliza con éxito el proceso HITL V&V, superando las limitaciones de la clasificación de fallas basada en reglas y ofreciendo un modelo escalable para la supervisión mediada por LLM en dominios de datos de series de tiempo.
Publicado originalmente en export.arxiv.org el 5 de abril de 2026.
Ver fuente original
