En este momento estás viendo 
<span class="bsf-rt-reading-time"><span class="bsf-rt-display-label" prefix="Tiempo de lectura"></span> <span class="bsf-rt-display-time" reading_time="1"></span> <span class="bsf-rt-display-postfix" postfix="mins"></span></span><!-- .bsf-rt-reading-time -->Synthpert: Mejora del razonamiento biológico de LLM a través de trazas de razonamiento sintético para la predicción de perturbación celular

Synthpert: Mejora del razonamiento biológico de LLM a través de trazas de razonamiento sintético para la predicción de perturbación celular

  • Autor de la entrada:
  • Categoría de la entrada:Noticias externas

Resumen: La predicción de las respuestas celulares a las perturbaciones genéticas representa un desafío fundamental en la biología de sistemas, crítico para avanzar en el descubrimiento terapéutico y el modelado de células virtuales. Mientras que los modelos de lenguaje grande (LLMS) son prometedores para el razonamiento biológico, su aplicación a la predicción de perturbaciones permanece subexplorada debido a los desafíos para adaptarlos a datos experimentales estructurados. Presentamos Synthpert, un método novedoso que mejora el rendimiento de LLM a través del ajuste fino supervisado en las trazas de razonamiento sintética generados por los modelos fronterizos. Usando el punto de referencia de Perturbqa, demostramos que nuestro enfoque no solo logra el rendimiento de última generación, sino que supera las capacidades del modelo fronterizo que generó los datos de capacitación. Nuestros resultados revelan tres ideas clave: (1) los trazas de razonamiento sintético destilan efectivamente el conocimiento biológico incluso cuando es parcialmente inexacto, (2) este enfoque permite que la generalización de tipo a través de células cruzadas con una precisión del 87% en las células RPE1 invisibles, y (3) las ganancias de rendimiento persistan a pesar de usar solo el 2% de los datos de entrenamiento de calidad de calidad. Este trabajo muestra la efectividad de la destilación de razonamiento sintético para mejorar el razonamiento específico del dominio en LLM.

Publicado Originalme en export.arxiv.org El 30 de septiembre de 2025.
Ver Fuente Original

admin

Usuario de administración del sitio web