GT-HarmBench: Evaluación comparativa de los riesgos de seguridad de la IA a través de la lente de la teoría de juegos

Resumen: Los sistemas de inteligencia artificial de frontera son cada vez más capaces y se implementan en entornos multiagente de alto riesgo. Sin embargo, los puntos de referencia de seguridad de la IA existentes evalúan en gran medida a agentes individuales, lo que deja poco comprendidos los riesgos de múltiples agentes, como la falla de coordinación y los conflictos.

Leer más →

Comentarios desactivados en GT-HarmBench: Evaluación comparativa de los riesgos de seguridad de la IA a través de la lente de la teoría de juegos

Análisis teórico de la información de modelos mundiales en maximizadores de recompensa óptimos.

Resumen: Una cuestión importante en el campo de la IA es hasta qué punto el comportamiento exitoso requiere una representación interna del mundo. En este trabajo, cuantificamos la cantidad de información que proporciona una política óptima sobre el entorno subyacente.

Leer más →

Comentarios desactivados en Análisis teórico de la información de modelos mundiales en maximizadores de recompensa óptimos.

BrowseComp-$V^3$: un punto de referencia visual, vertical y verificable para agentes de navegación multimodal

Resumen: Los modelos de lenguajes grandes multimodales (MLLM), equipados con capacidades de uso de herramientas y planificación cada vez más avanzadas, están evolucionando hacia agentes autónomos capaces de realizar navegación web multimodal y búsqueda profunda en entornos de mundo abierto.

Leer más →

Comentarios desactivados en BrowseComp-$V^3$: un punto de referencia visual, vertical y verificable para agentes de navegación multimodal

Fin del contenido

No hay más páginas por cargar