Resumen:Presentamos ResearchGym, un entorno de ejecución y referencia para evaluar agentes de IA en investigaciones de un extremo a otro. Para ejemplificar esto, reutilizamos cinco artículos orales y destacados de ICML, ICLR y ACL.
Leer más →
Resumen:Este trabajo presenta EduEVAL-DB, un conjunto de datos basado en roles docentes diseñado para apoyar la evaluación y capacitación de evaluadores pedagógicos automáticos y tutores de IA para explicaciones instructivas.
Leer más →
Resumen: Los gliomas, uno de los tumores cerebrales primarios más comunes, varían ampliamente en agresividad, pronóstico e histología, lo que hace que el tratamiento sea un desafío debido a intervenciones quirúrgicas complejas y que requieren mucho tiempo. Este estudio presenta un modelo triplanar (2.
Leer más →