GT-HarmBench: Evaluación comparativa de los riesgos de seguridad de la IA a través de la lente de la teoría de juegos
Resumen: Los sistemas de inteligencia artificial de frontera son cada vez más capaces y se implementan en entornos multiagente de alto riesgo. Sin embargo, los puntos de referencia de seguridad de la IA existentes evalúan en gran medida a agentes individuales, lo que deja poco comprendidos los riesgos de múltiples agentes, como la falla de coordinación y los conflictos.
Leer más →