En este momento estás viendo 
<span class="bsf-rt-reading-time"><span class="bsf-rt-display-label" prefix="Tiempo de lectura"></span> <span class="bsf-rt-display-time" reading_time="1"></span> <span class="bsf-rt-display-postfix" postfix="mins"></span></span><!-- .bsf-rt-reading-time -->SynllM: un análisis comparativo de modelos de lenguaje grande para la generación de datos sintéticos tabulares médicos a través de ingeniería rápida

SynllM: un análisis comparativo de modelos de lenguaje grande para la generación de datos sintéticos tabulares médicos a través de ingeniería rápida

  • Autor de la entrada:
  • Categoría de la entrada:Noticias externas

Resumen: En este documento, presentamos SynllM, un marco modular para generar datos tabulares médicos sintéticos de alta calidad utilizando 20 Variantes de código abierto de última generación, incluidas las variantes de LLAMA, Mistral y GPT, guiados por indicaciones estructuradas. Proponemos cuatro tipos de inmediato distintos, que van desde las restricciones basadas en reglas hasta las reglas, que codifican el esquema, los metadatos y el conocimiento del dominio para controlar la generación sin ajuste del modelo. Nuestro marco presenta una tubería de evaluación integral que evalúa rigurosamente los datos generados a través de la fidelidad estadística, la consistencia clínica y la preservación de la privacidad.
Evaluamos SynllM en tres conjuntos de datos médicos públicos, incluidas diabetes, cirrosis y accidente cerebrovascular, utilizando 20 LLM de código abierto. Nuestros resultados muestran que la ingeniería inmediata afecta significativamente la calidad de los datos y el riesgo de privacidad, con indicaciones basadas en reglas que logran el mejor equilibrio de calidad de privacidad. SynllM establece que, cuando se guía por indicaciones bien diseñadas y se evalúa con criterios sólidos y multimétricos, los LLM pueden generar datos médicos sintéticos que son clínicamente plausibles y conscientes de la privacidad, allanando el camino para un intercambio de datos más seguro y más efectivo en la investigación de atención médica.

Publicado Originalme en export.arxiv.org El 12 de agosto de 2025.
Ver Fuente Original

admin

Usuario de administración del sitio web