Evaluación del razonamiento de LLM a través del descubrimiento de cadenas causales implícitas en el discurso climático

Resumen: ¿Cómo una causa conduce a un efecto y qué pasos causales intermedios explican su conexión? Este trabajo examina las capacidades de razonamiento causal mecanicista de los modelos de lenguaje grande (LLM) para responder estas preguntas a través de la tarea de descubrimiento de cadenas causales implícitas.

Leer más →

Comentarios desactivados en Evaluación del razonamiento de LLM a través del descubrimiento de cadenas causales implícitas en el discurso climático

Optimización de políticas aprendibles desde la teoría de juegos para la racionalización de la autoexplicación centrada en datos

Resumen: La racionalización, un marco centrado en datos, tiene como objetivo construir modelos que se explican por sí mismos para explicar el resultado de la predicción generando un subconjunto de piezas de datos de entrada inteligibles para los humanos.

Leer más →

Comentarios desactivados en Optimización de políticas aprendibles desde la teoría de juegos para la racionalización de la autoexplicación centrada en datos

SAJA: Un marco de ataque conjunto de acción estatal sobre el aprendizaje por refuerzo profundo de múltiples agentes

Resumen: El aprendizaje por refuerzo profundo multiagente (MADRL) ha demostrado potencial para tareas cooperativas y competitivas como la conducción autónoma y los juegos estratégicos. Sin embargo, los modelos entrenados por MADRL son vulnerables a perturbaciones adversas en estados y acciones. Por tanto, es fundamental investigar la robustez de los modelos MADRL desde una perspectiva de ataque.

Leer más →

Comentarios desactivados en SAJA: Un marco de ataque conjunto de acción estatal sobre el aprendizaje por refuerzo profundo de múltiples agentes

Fin del contenido

No hay más páginas por cargar