Resumen: Se supone ampliamente que las representaciones no supervisadas son neutrales con respecto a los atributos sensibles cuando esos atributos no se incluyen en el entrenamiento. Demostramos que esta suposición es falsa.
Leer más →
Resumen:La comprensión del lenguaje natural requiere entrelazar razonamiento textual y lógico, pero los modelos de lenguaje grandes a menudo no logran realizar dicho razonamiento de manera confiable.
Leer más →
Resumen:La capacitación previa en políticas de robots escalables se ha visto obstaculizada por el alto costo de recopilar demostraciones de alta calidad para cada plataforma. En este estudio, abordamos este problema uniendo el aprendizaje por refuerzo fuera de línea (RL fuera de línea) con el aprendizaje entre encarnaciones.
Leer más →