Resumen: ¿Cómo una causa conduce a un efecto y qué pasos causales intermedios explican su conexión? Este trabajo examina las capacidades de razonamiento causal mecanicista de los modelos de lenguaje grande (LLM) para responder estas preguntas a través de la tarea de descubrimiento de cadenas causales implícitas.
Leer más →
Resumen: La racionalización, un marco centrado en datos, tiene como objetivo construir modelos que se explican por sí mismos para explicar el resultado de la predicción generando un subconjunto de piezas de datos de entrada inteligibles para los humanos.
Leer más →
Resumen: El aprendizaje por refuerzo profundo multiagente (MADRL) ha demostrado potencial para tareas cooperativas y competitivas como la conducción autónoma y los juegos estratégicos. Sin embargo, los modelos entrenados por MADRL son vulnerables a perturbaciones adversas en estados y acciones. Por tanto, es fundamental investigar la robustez de los modelos MADRL desde una perspectiva de ataque.
Leer más →