Resumen: Los modelos mundiales han demostrado una gran utilidad para mejorar el desempeño de tareas de agentes encarnados. Si bien el trabajo anterior se centra principalmente en modelos mundiales de espacio de píxeles, estos enfoques enfrentan limitaciones prácticas en entornos de GUI, donde a menudo es difícil predecir elementos visuales complejos en estados futuros.
Leer más →
Resumen: La revisión manual de historias clínicas sigue siendo un componente de la investigación clínica que requiere mucho tiempo y recursos, y requiere que los expertos extraigan información a menudo compleja de narrativas de registros médicos electrónicos (EHR) no estructurados.
Leer más →
Resumen: Las arquitecturas dispersas de mezcla de expertos (MoE) escalan efectivamente la capacidad del modelo activando solo un subconjunto de expertos para cada token de entrada. Sin embargo, la estrategia de enrutamiento estándar Top-k impone un patrón de escasez uniforme que ignora la dificultad variable de los tokens.
Leer más →