En este momento estás viendo 
<span class="bsf-rt-reading-time"><span class="bsf-rt-display-label" prefix="Tiempo de lectura"></span> <span class="bsf-rt-display-time" reading_time="2"></span> <span class="bsf-rt-display-postfix" postfix="mins"></span></span><!-- .bsf-rt-reading-time -->Modelo de base generativo para registros de salud electrónicos estructurados y no estructurados

Modelo de base generativo para registros de salud electrónicos estructurados y no estructurados

  • Autor de la entrada:
  • Categoría de la entrada:Noticias externas

Resumen: Los registros de salud electrónicos (EHR) son fuentes de datos clínicos ricos pero repositorios complejos de los datos del paciente, que abarcan elementos estructurados (demografía, vital, resultados de laboratorio, códigos), notas clínicas no estructuradas y otras modalidades de datos. Aprovechar esta heterogeneidad es fundamental para mejorar los resultados de los pacientes. Los avances recientes en modelos de idiomas grandes (LLM) han habilitado modelos de base que pueden aprender de múltiples modalidades de datos y respaldar tareas clínicas. Sin embargo, la mayoría de los enfoques actuales simplemente serializan los datos numéricos de EHR en texto, lo que corre el riesgo de perder detalles temporales y cuantitativos. Introducimos al paciente profundo generativo (GDP), un modelo de base multimodal que codifica de forma nativa la serie de tiempo EHR estructurada a través de un codificador de transformador CNN y lo fusiona con EHR no estructurados a través de la atención cruzada en un decodificador basado en un llama. El PIB está entrenado en dos etapas: (1) Pretratenamiento generativo, donde aprende a producir narraciones clínicas a partir de plazos de pacientes crudos al tiempo que realiza una predicción de características enmascaradas (MFP) y la próxima predicción de paso de tiempo (NTP) para capturar la dinámica temporal; y (2) ajuste de múltiples tareas para predicciones clínicamente significativas (por ejemplo, insuficiencia cardíaca, diabetes tipo 2, reingreso de 30 días). En la predicción clínica, el PIB demostró un rendimiento superior en MIMIC-IV: insuficiencia cardíaca AUROC = 0.923, diabetes tipo 2 AUROC = 0.817 y reingreso de 30 días AUROC = 0.627. Para la generación narrativa, el PIB logró Rouge-L = 0.135 y Bertscore-F1 = 0.545. En una evaluación humana cegada, el INSTRUME DEL PIB obtuvo la mayor puntuación de fidelidad, fluidez y utilidad clínica general, lo que sugiere una carga de trabajo de documentación hospitalaria reducida sin sacrificar la precisión. Nuestros resultados demuestran que un modelo de base multimodal único puede predecir eventos clínicamente procesables y generar narrativas clínicas de alta calidad. Además, la arquitectura flexible del PIB se puede extender a modalidades adicionales.

Publicado Originalme en export.arxiv.org El 24 de agosto de 2025.
Ver Fuente Original

admin

Usuario de administración del sitio web