Resumen: Presentamos un marco de representación de gráficos centrado en la acción para aprender a guiar la planificación en procesos de decisión de Markov parcialmente observables (POMDP).
Leer más →
Resumen: Los modelos de lenguajes grandes (LLM) han logrado un éxito notable en diversas tareas, pero su alineación de seguridad sigue siendo frágil durante la adaptación. Incluso cuando se ajustan datos benignos o con una adaptación de bajo rango, los comportamientos de seguridad previamente entrenados se degradan fácilmente, lo que genera respuestas dañinas en los modelos ajustados.
Leer más →
Resumen: El aprendizaje causal es el proceso cognitivo de desarrollar la capacidad de hacer inferencias causales basadas en la información disponible, a menudo guiada por principios normativos. Este proceso es propenso a errores y sesgos, como la ilusión de causalidad, en la que las personas perciben una relación causal entre dos variables a pesar de carecer de evidencia que lo respalde.
Leer más →