Resumen: La predicción oportuna del alta es esencial para optimizar la rotación de camas y la asignación de recursos en unidades de cirugía electiva de columna. Este estudio evalúa la viabilidad de modelos de lenguaje grande (LLM) ligeros y ajustados y modelos tradicionales basados en texto para predecir el alta al día siguiente utilizando notas clínicas posoperatorias. Comparamos 13 modelos, incluido TF-IDF con XGBoost y LGBM, y LLM compactos (DistilGPT-2, Bio_ClinicalBERT) ajustados mediante LoRA. TF-IDF con LGBM logró el mejor equilibrio, con una puntuación F1 de 0,47 para la clase de descarga, una recuperación de 0,51 y el AUC-ROC más alto (0,80). Si bien LoRA mejoró la recuperación en DistilGPT2, los modelos generativos y basados en transformadores en general tuvieron un rendimiento inferior. Estos hallazgos sugieren que los modelos interpretables y eficientes en recursos pueden superar a los LLM compactos en tareas de predicción clínica desequilibradas del mundo real.
Publicado originalmente en export.arxiv.org el 6 de abril de 2026.
Ver fuente original
