Resumen: Hacer trampa en el ajedrez, utilizando consejos de potentes software, se ha convertido en un gran problema, alcanzando los niveles más altos. A diferencia de la gran mayoría de trabajos anteriores, que se referían a la {em detección} de trampas, aquí intentamos evaluar la posible ganancia en rendimiento obtenida al hacer trampa un número limitado de veces durante un juego.
Leer más →
Resumen:A medida que los agentes de IA operan cada vez más en entornos de múltiples agentes, comprender su comportamiento colectivo se vuelve fundamental para predecir la dinámica de las sociedades artificiales. Este estudio examina la conformidad, la tendencia a alinearse con opiniones grupales bajo presión social, en grandes modelos de lenguaje multimodal que funcionan como agentes de IA.
Leer más →
Resumen: El condicionamiento personal puede verse como un comportamiento previo para los modelos de lenguaje grandes (LLM) y a menudo se supone que confiere experiencia y mejora la seguridad de una manera monótona. Sin embargo, sus efectos en la toma de decisiones clínicas de alto riesgo siguen estando mal caracterizados.
Leer más →