Aprender agentes personalizados a partir de la retroalimentación humana
Resumen: Los agentes de IA modernos son poderosos, pero a menudo no logran alinearse con las preferencias idiosincrásicas y cambiantes de los usuarios individuales. Los enfoques anteriores generalmente se basan en conjuntos de datos estáticos, ya sea entrenando modelos de preferencias implícitas en el historial de interacciones o codificando perfiles de usuario en una memoria externa.
Leer más →