Resumen: Se ha propuesto una gran cantidad de ataques con jailbreaking para obtener respuestas dañinas de LLMS ajustados a la seguridad. Estos métodos logran coaccionar la salida objetivo en sus entornos originales, pero sus ataques varían sustancialmente en la fluidez y el esfuerzo computacional.
Leer más →
Resumen: Un gran desafío para la IA moderna es aprender a comprender el mundo y aprender a actuar en gran medida por observación. Este documento explora un enfoque auto-supervisado que combina datos de video a escala de Internet con una pequeña cantidad de datos de interacción (trayectorias de robots), para desarrollar modelos capaces de comprender, predecir y planificar en el mundo físico.
Leer más →
Resumen: Comprender cómo los humanos revisan sus creencias a la luz de la nueva información es crucial para desarrollar sistemas de IA que puedan modelar efectivamente y, por lo tanto, alinearse con el razonamiento humano.
Leer más →