Trism para AI de Agente: una revisión de la gestión de confianza, riesgo y seguridad en sistemas de agentes de agentes con sede en LLM

Resumen: Los sistemas de IA de agente, construidos en modelos de idiomas grandes (LLM) y desplegados en configuraciones de múltiples agentes, están redefiniendo la autonomía inteligente, la colaboración y la toma de decisiones en los dominios empresariales y sociales. Esta revisión presenta un análisis estructurado de la gestión de confianza, riesgo y seguridad (Trism) en el contexto de los sistemas de agentes de agentes (AMA) basados en LLM. Comenzamos examinando los fundamentos conceptuales de la IA agente, sus diferencias arquitectónicas de los agentes de IA tradicionales y los diseños de sistemas emergentes que permiten una autonomía escalable y de uso de herramientas. El trish en el marco de AI de agente se detalla a través de cuatro pilares de gobernanza, explicabilidad, modelops y privacidad/seguridad cada uno contextualizado para LLM de agente. Identificamos vectores de amenazas únicos e introducimos una taxonomía de riesgo integral para las aplicaciones de IA de agente, respaldadas por estudios de casos que ilustran las vulnerabilidades del mundo real. Además, el documento también examina mecanismos de construcción de confianza, técnicas de transparencia y supervisión, y estrategias de explicabilidad de vanguardia en los sistemas de agentes LLM distribuidos. Además, las métricas para evaluar la confianza, la interpretabilidad y el desempeño centrado en el ser humano se revisan junto con desafíos de evaluación comparativa abierta. La seguridad y la privacidad se abordan a través del cifrado, la defensa adversaria y el cumplimiento de la evolución de las regulaciones de IA. El documento concluye con una hoja de ruta para la IA agente responsable, que propone instrucciones de investigación para alinear sistemas emergentes de múltiples agentes con principios de trish robustos para una implementación segura, responsable y transparente.

Publicado Originalme en rss.arxiv.org El 4 de junio de 2025.
Ver Fuente Original

admin

Aviso de privacidad

Súbete a la ola del IoT

Contacto

Please Share This Compartir este contenido

admin

También podría gustarte

Webinar conjunta One6g/AIOti “Robótica 6G Empowered”

Co-EPG: un marco para la coevolución de la planificación y la puesta a tierra en agentes GUI autónomos

Esta empresa planea un imperio del litio a orillas del Gran Lago Salado

Aviso de privacidad

test

Súbete a la ola del IoT

Contacto

Compartir este contenido