Resumen: La infraestructura industrial de misión crítica, como los centros de datos, depende cada vez más del software de gestión compleja. Sin embargo, sus operaciones plantean desafíos significativos debido a la complejidad del sistema creciente, la integración de múltiples proveedores y la escasez de operadores expertos. Si bien la automatización de procesos robóticos (RPA) ofrece automatización parcial a través de scripts hechos a mano, sufre de flexibilidad limitada y altos costos de mantenimiento. Los avances recientes en los agentes de interfaz gráfica de usuario (GUI) basada en el modelo de lenguaje grande (LLM) han permitido una automatización más flexible, sin embargo, estos agentes de uso general enfrentan cinco desafíos críticos cuando se aplican a la gestión industrial, incluida la comprensión de elementos desconocidos, la precisión y la eficiencia, la localización del estado, las limitaciones de implementación y los requisitos de seguridad. Para abordar estos problemas, proponemos inframind, un nuevo marco de agente de GUI basado en la exploración específicamente adaptado para los sistemas de gestión industrial. Inframind integra cinco módulos innovadores para resolver sistemáticamente diferentes desafíos en la gestión industrial: (1) exploración sistemática basada en la búsqueda con instantáneas de máquinas virtuales para una comprensión autónoma de GUI complejas; (2) planificación impulsada por la memoria para garantizar una ejecución de tareas eficiente y alta en precisión; (3) identificación de estado avanzado para una localización robusta en interfaces jerárquicas; (4) destilación de conocimiento estructurado para una implementación eficiente con modelos livianos; y (5) mecanismos integrales de seguridad de múltiples capas para salvaguardar las operaciones sensibles. Extensos experimentos en plataformas DCIM de código abierto y de código abierto demuestran que nuestro enfoque supera constantemente los marcos existentes en términos de tasa de éxito de tareas y eficiencia operativa, proporcionando una solución rigurosa y escalable para la automatización de la gestión industrial.
Publicado Originalme en export.arxiv.org El 17 de septiembre de 2025.
Ver Fuente Original