Resumen: La escala en el tiempo de prueba ha permitido que los modelos de lenguajes grandes (LLM) aborden el razonamiento complejo, sin embargo, las limitaciones de la evaluación actual de la cadena de pensamiento (CoT) oscurecen si las mejoras en el desempeño se derivan de un razonamiento genuino o de una mera verbosidad.
Leer más →
Resumen:La defensa contra ataques de jailbreak es crucial para la implementación segura de modelos de lenguaje grande (LLM). Investigaciones recientes han intentado mejorar la seguridad entrenando modelos para razonar sobre las reglas de seguridad antes de responder.
Leer más →
Resumen: Una de las cuestiones más importantes en la recopilación de conocimientos es el recuento de modelos ponderados (WMC), que se ha aplicado a la inferencia probabilística en varios modelos, como las redes bayesianas.
Leer más →