SynllM: un análisis comparativo de modelos de lenguaje grande para la generación de datos sintéticos tabulares médicos a través de ingeniería rápida

Resumen: En este documento, presentamos SynllM, un marco modular para generar datos tabulares médicos sintéticos de alta calidad utilizando 20 Variantes de código abierto de última generación, incluidas las variantes de LLAMA, Mistral y GPT, guiados por indicaciones estructuradas. Proponemos cuatro tipos de inmediato distintos, que van desde las restricciones basadas en reglas hasta las reglas, que codifican el esquema, los metadatos y el conocimiento del dominio para controlar la generación sin ajuste del modelo. Nuestro marco presenta una tubería de evaluación integral que evalúa rigurosamente los datos generados a través de la fidelidad estadística, la consistencia clínica y la preservación de la privacidad.
Evaluamos SynllM en tres conjuntos de datos médicos públicos, incluidas diabetes, cirrosis y accidente cerebrovascular, utilizando 20 LLM de código abierto. Nuestros resultados muestran que la ingeniería inmediata afecta significativamente la calidad de los datos y el riesgo de privacidad, con indicaciones basadas en reglas que logran el mejor equilibrio de calidad de privacidad. SynllM establece que, cuando se guía por indicaciones bien diseñadas y se evalúa con criterios sólidos y multimétricos, los LLM pueden generar datos médicos sintéticos que son clínicamente plausibles y conscientes de la privacidad, allanando el camino para un intercambio de datos más seguro y más efectivo en la investigación de atención médica.

Publicado Originalme en export.arxiv.org El 12 de agosto de 2025.
Ver Fuente Original

admin

Aviso de privacidad

Súbete a la ola del IoT

Contacto

Please Share This Compartir este contenido

admin

También podría gustarte

Sparkui-Parser: Mejora de la percepción de la GUI con sólida conexión a tierra y análisis

Más allá del equilibrio de Nash: racionalidad limitada de LLM y humanos en la toma de decisiones estratégicas

Cómo Yichao “Peak” Ji se convirtió en un creador de éxitos globales de aplicaciones de IA

Aviso de privacidad

test

Súbete a la ola del IoT

Contacto

Compartir este contenido