MobileWorldBench: hacia el modelado del mundo semántico para agentes móviles

Resumen: Los modelos mundiales han demostrado una gran utilidad para mejorar el desempeño de tareas de agentes encarnados. Si bien el trabajo anterior se centra principalmente en modelos mundiales de espacio de píxeles, estos enfoques enfrentan limitaciones prácticas en entornos de GUI, donde a menudo es difícil predecir elementos visuales complejos en estados futuros.

Leer más →

Comentarios desactivados en MobileWorldBench: hacia el modelado del mundo semántico para agentes móviles

Aprovechamiento de los LLM para la extracción de datos estructurados de registros de pacientes no estructurados

Resumen: La revisión manual de historias clínicas sigue siendo un componente de la investigación clínica que requiere mucho tiempo y recursos, y requiere que los expertos extraigan información a menudo compleja de narrativas de registros médicos electrónicos (EHR) no estructurados.

Leer más →

Comentarios desactivados en Aprovechamiento de los LLM para la extracción de datos estructurados de registros de pacientes no estructurados

MoE Top-p dinámico controlable por escasez para preentrenamiento de modelos de cimientos grandes

Resumen: Las arquitecturas dispersas de mezcla de expertos (MoE) escalan efectivamente la capacidad del modelo activando solo un subconjunto de expertos para cada token de entrada. Sin embargo, la estrategia de enrutamiento estándar Top-k impone un patrón de escasez uniforme que ignora la dificultad variable de los tokens.

Leer más →

Comentarios desactivados en MoE Top-p dinámico controlable por escasez para preentrenamiento de modelos de cimientos grandes

Fin del contenido

No hay más páginas por cargar