Resumen: Los cálculos de tamaño de la muestra para el análisis de energía son críticos para la investigación clínica y el diseño del ensayo, sin embargo, su complejidad y dependencia de la experiencia estadística crean barreras para muchos investigadores. Introducimos PowerGPT, un sistema con IA que integra modelos de lenguaje grande (LLM) con motores estadísticos para automatizar la selección de pruebas y la estimación del tamaño de la muestra en el diseño de la prueba. En un ensayo aleatorizado para evaluar su efectividad, PowerGPT mejoró significativamente las tasas de finalización de la tarea (99.3% frente a 88.9% para la selección de pruebas, 99.3% frente a 77.8% para el cálculo del tamaño de la muestra) y la precisión (94.1% frente a 55.4% en la estimación del tamaño de la muestra, p <0.001), mientras reduce el tiempo promedio de finalización (4.0 vs. 9.3 minutos, p <0.001). Estas ganancias fueron consistentes en varias pruebas estadísticas y beneficiaron tanto a los estadísticos como a los no estadísticos, así como a las brechas de experiencia en puente. Ya bajo el despliegue en múltiples instituciones, PowerGPT representa un enfoque escalable impulsado por la IA que mejora la accesibilidad, la eficiencia y la precisión en el análisis de energía estadística para la investigación clínica.
Publicado Originalme en export.arxiv.org El 16 de septiembre de 2025.
Ver Fuente Original