Modelo de base generativo para registros de salud electrónicos estructurados y no estructurados

Resumen: Los registros de salud electrónicos (EHR) son fuentes de datos clínicos ricos pero repositorios complejos de los datos del paciente, que abarcan elementos estructurados (demografía, vital, resultados de laboratorio, códigos), notas clínicas no estructuradas y otras modalidades de datos. Aprovechar esta heterogeneidad es fundamental para mejorar los resultados de los pacientes. Los avances recientes en modelos de idiomas grandes (LLM) han habilitado modelos de base que pueden aprender de múltiples modalidades de datos y respaldar tareas clínicas. Sin embargo, la mayoría de los enfoques actuales simplemente serializan los datos numéricos de EHR en texto, lo que corre el riesgo de perder detalles temporales y cuantitativos. Introducimos al paciente profundo generativo (GDP), un modelo de base multimodal que codifica de forma nativa la serie de tiempo EHR estructurada a través de un codificador de transformador CNN y lo fusiona con EHR no estructurados a través de la atención cruzada en un decodificador basado en un llama. El PIB está entrenado en dos etapas: (1) Pretratenamiento generativo, donde aprende a producir narraciones clínicas a partir de plazos de pacientes crudos al tiempo que realiza una predicción de características enmascaradas (MFP) y la próxima predicción de paso de tiempo (NTP) para capturar la dinámica temporal; y (2) ajuste de múltiples tareas para predicciones clínicamente significativas (por ejemplo, insuficiencia cardíaca, diabetes tipo 2, reingreso de 30 días). En la predicción clínica, el PIB demostró un rendimiento superior en MIMIC-IV: insuficiencia cardíaca AUROC = 0.923, diabetes tipo 2 AUROC = 0.817 y reingreso de 30 días AUROC = 0.627. Para la generación narrativa, el PIB logró Rouge-L = 0.135 y Bertscore-F1 = 0.545. En una evaluación humana cegada, el INSTRUME DEL PIB obtuvo la mayor puntuación de fidelidad, fluidez y utilidad clínica general, lo que sugiere una carga de trabajo de documentación hospitalaria reducida sin sacrificar la precisión. Nuestros resultados demuestran que un modelo de base multimodal único puede predecir eventos clínicamente procesables y generar narrativas clínicas de alta calidad. Además, la arquitectura flexible del PIB se puede extender a modalidades adicionales.

Publicado Originalme en export.arxiv.org El 24 de agosto de 2025.
Ver Fuente Original

admin

Aviso de privacidad

Súbete a la ola del IoT

Contacto

Please Share This Compartir este contenido

admin

También podría gustarte

La búsqueda de la fusión de Dennis Whyte

Bosch Bytes Atenas 2025 establece el tono para futuros eventos de Bosch SDS en Europa

La descarga: el próximo arma anti-drone y el crecimiento de la IA impulsando

Aviso de privacidad

test

Súbete a la ola del IoT

Contacto

Compartir este contenido