ResearchGym: Evaluación de agentes de modelos de lenguaje en investigaciones de IA del mundo real

Resumen:Presentamos ResearchGym, un entorno de ejecución y referencia para evaluar agentes de IA en investigaciones de un extremo a otro. Para ejemplificar esto, reutilizamos cinco artículos orales y destacados de ICML, ICLR y ACL.

Leer más →

Comentarios desactivados en ResearchGym: Evaluación de agentes de modelos de lenguaje en investigaciones de IA del mundo real

GenAI-LA: Taller de análisis de aprendizaje e inteligencia artificial generativa (LAK 2026), del 27 de abril al 1 de mayo de 2026, Bergen, Noruega

Resumen:Este trabajo presenta EduEVAL-DB, un conjunto de datos basado en roles docentes diseñado para apoyar la evaluación y capacitación de evaluadores pedagógicos automáticos y tutores de IA para explicaciones instructivas.

Leer más →

Comentarios desactivados en GenAI-LA: Taller de análisis de aprendizaje e inteligencia artificial generativa (LAK 2026), del 27 de abril al 1 de mayo de 2026, Bergen, Noruega

Modelo U-Net activado por la atención para la segmentación semántica de tumores cerebrales y extracción de características para el pronóstico de supervivencia

Resumen: Los gliomas, uno de los tumores cerebrales primarios más comunes, varían ampliamente en agresividad, pronóstico e histología, lo que hace que el tratamiento sea un desafío debido a intervenciones quirúrgicas complejas y que requieren mucho tiempo. Este estudio presenta un modelo triplanar (2.

Leer más →

Comentarios desactivados en Modelo U-Net activado por la atención para la segmentación semántica de tumores cerebrales y extracción de características para el pronóstico de supervivencia

Fin del contenido

No hay más páginas por cargar