ESL-Bench: un punto de referencia longitudinal sintético impulsado por eventos para agentes de salud
Resumen: Los agentes de salud longitudinales deben razonar a través de trayectorias de múltiples fuentes que combinan flujos continuos de dispositivos, escasos exámenes clínicos y eventos vitales episódicos; sin embargo, evaluarlos es difícil: los datos del mundo real no se pueden publicar a escala, y las preguntas de atribución basadas temporalmente rara vez admiten respuestas definitivas sin un
Leer más →