Resumen: El aprendizaje por refuerzo de múltiples agentes en línea (MARL) es un marco destacado para la coordinación eficiente de agentes. Fundamentalmente, mejorar la expresividad de las políticas es fundamental para lograr un desempeño superior.
Leer más →
Resumen: Se supone ampliamente que las representaciones no supervisadas son neutrales con respecto a los atributos sensibles cuando esos atributos no se incluyen en el entrenamiento. Demostramos que esta suposición es falsa.
Leer más →
Resumen:La comprensión del lenguaje natural requiere entrelazar razonamiento textual y lógico, pero los modelos de lenguaje grandes a menudo no logran realizar dicho razonamiento de manera confiable.
Leer más →