En este momento estás viendo 
<span class="bsf-rt-reading-time"><span class="bsf-rt-display-label" prefix="Tiempo de lectura"></span> <span class="bsf-rt-display-time" reading_time="2"></span> <span class="bsf-rt-display-postfix" postfix="mins"></span></span><!-- .bsf-rt-reading-time -->Trism para AI de Agente: una revisión de la gestión de confianza, riesgo y seguridad en sistemas de agentes de agentes con sede en LLM

Trism para AI de Agente: una revisión de la gestión de confianza, riesgo y seguridad en sistemas de agentes de agentes con sede en LLM

  • Autor de la entrada:
  • Categoría de la entrada:Noticias externas

Resumen: Los sistemas de IA de agente, construidos en modelos de idiomas grandes (LLM) y desplegados en configuraciones de múltiples agentes, están redefiniendo la autonomía inteligente, la colaboración y la toma de decisiones en los dominios empresariales y sociales. Esta revisión presenta un análisis estructurado de la gestión de confianza, riesgo y seguridad (Trism) en el contexto de los sistemas de agentes de agentes (AMA) basados ​​en LLM. Comenzamos examinando los fundamentos conceptuales de la IA agente, sus diferencias arquitectónicas de los agentes de IA tradicionales y los diseños de sistemas emergentes que permiten una autonomía escalable y de uso de herramientas. El trish en el marco de AI de agente se detalla a través de cuatro pilares de gobernanza, explicabilidad, modelops y privacidad/seguridad cada uno contextualizado para LLM de agente. Identificamos vectores de amenazas únicos e introducimos una taxonomía de riesgo integral para las aplicaciones de IA de agente, respaldadas por estudios de casos que ilustran las vulnerabilidades del mundo real. Además, el documento también examina mecanismos de construcción de confianza, técnicas de transparencia y supervisión, y estrategias de explicabilidad de vanguardia en los sistemas de agentes LLM distribuidos. Además, las métricas para evaluar la confianza, la interpretabilidad y el desempeño centrado en el ser humano se revisan junto con desafíos de evaluación comparativa abierta. La seguridad y la privacidad se abordan a través del cifrado, la defensa adversaria y el cumplimiento de la evolución de las regulaciones de IA. El documento concluye con una hoja de ruta para la IA agente responsable, que propone instrucciones de investigación para alinear sistemas emergentes de múltiples agentes con principios de trish robustos para una implementación segura, responsable y transparente.

Publicado Originalme en rss.arxiv.org El 4 de junio de 2025.
Ver Fuente Original

admin

Usuario de administración del sitio web