Resumen:La defensa contra ataques de jailbreak es crucial para la implementación segura de modelos de lenguaje grande (LLM). Investigaciones recientes han intentado mejorar la seguridad entrenando modelos para razonar sobre las reglas de seguridad antes de responder.
Leer más →
Resumen: Una de las cuestiones más importantes en la recopilación de conocimientos es el recuento de modelos ponderados (WMC), que se ha aplicado a la inferencia probabilística en varios modelos, como las redes bayesianas.
Leer más →
Resumen: Estudiamos la adquisición continua de habilidades en entornos incorporados abiertos donde un agente debe construir, refinar y reutilizar una biblioteca en expansión de habilidades ejecutables. Presentamos la Programmatic Skill Network (PSN), un marco en el que las habilidades son programas simbólicos ejecutables que forman una red compositiva que evoluciona a través de la experiencia.
Leer más →