Resumen: El desperdicio de investigación en la ciencia biomédica está impulsado por estudios redundantes, informes incompletos y la escalabilidad limitada de los flujos de trabajo tradicionales de síntesis de evidencia. Presentamos un cocientífico de IA para una síntesis de conocimiento escalable y transparente basada en la formalización explícita del diseño de población, intervención, comparador, resultado y estudio (PICOS). La plataforma integra almacenamiento relacional, recuperación semántica basada en vectores y un gráfico de conocimiento Neo4j. Se realizó una evaluación de los corpus demencia-deporte y enfermedades no transmisibles. El cumplimiento automatizado de PICOS y la clasificación del diseño del estudio a partir de títulos y resúmenes se realizaron utilizando una línea de base de memoria bidireccional a largo plazo y un clasificador multitarea basado en transformador ajustado desde PubMedBERT. La síntesis de texto completo empleó generación de recuperación aumentada con recuperación híbrida de vectores y gráficos, mientras que BERTopic se utilizó para identificar la estructura temática, la redundancia y las lagunas de evidencia. El modelo de transformador logró una precisión del 95,7 % para la clasificación del diseño del estudio con un fuerte acuerdo con las anotaciones de expertos, mientras que el Bi-LSTM logró una precisión del 87 % para la detección de cumplimiento de PICOS. La generación con recuperación aumentada superó a la generación sin recuperación para consultas que requerían restricciones estructuradas, integración de estudios cruzados y razonamiento basado en gráficos, mientras que los enfoques sin recuperación siguieron siendo competitivos para resúmenes de alto nivel. El modelado de temas reveló una redundancia temática sustancial e identificó áreas de investigación poco exploradas. Estos resultados demuestran que el procesamiento del lenguaje natural explicable y consciente de PICOS puede mejorar la escalabilidad, la transparencia y la eficiencia de la síntesis de evidencia. La arquitectura propuesta es independiente del dominio y ofrece un marco práctico para reducir el desperdicio de investigación en las disciplinas biomédicas.
Publicado originalmente en export.arxiv.org el 20 de enero de 2026.
Ver fuente original
