Resumen: Investigamos la estimación del efecto causal de una variable de tratamiento en un resultado en presencia de un factor de confusión latente. Primero mostramos que el efecto causal es identificable bajo ciertas condiciones cuando los datos están disponibles en múltiples entornos, siempre que el efecto causal objetivo permanezca invariante en estos entornos.
Leer más →
Resumen: Las redes neuronales de gráficos relacionales (R-GNN) son un enfoque basado en GNN para las funciones de valor de aprendizaje que pueden generalizarse a problemas invisibles de un dominio de planificación determinado. Los R-GNN se motivaron teóricamente por la conexión bien conocida entre el poder expresivo de GNN y $ C_2 $, lógica de primer orden con dos variables y contamiento.
Leer más →
Resumen: La optimización de preferencias directas (DPO) ha surgido como un enfoque efectivo para mitigar la alucinación en modelos de lenguaje grande (MLLM) multimodales.
Leer más →