Resumen: Las conclusiones de la investigación empírica dependen no sólo de los datos sino de una secuencia de decisiones analíticas que los resultados publicados rara vez hacen explícitos. Estudios anteriores de “muchos analistas” han demostrado esto: equipos independientes que prueban la misma hipótesis en el mismo conjunto de datos regularmente llegan a conclusiones contradictorias. Pero tales estudios requieren meses de coordinación entre docenas de grupos de investigación y, por lo tanto, rara vez se llevan a cabo. En este trabajo, mostramos que los analistas de IA totalmente autónomos construidos sobre grandes modelos de lenguaje (LLM) pueden reproducir una diversidad analítica estructurada similar de manera económica y a escala. encuadre entre ejecuciones replicadas, cada analista de IA construye y ejecuta de forma independiente un proceso de análisis completo; luego, un auditor de IA examina cada ejecución para verificar su validez metodológica en tres conjuntos de datos que abarcan diseños experimentales y observacionales, los análisis producidos por analistas de IA muestran una amplia dispersión en los tamaños de los efectos, los valores de $p$ y las decisiones binarias sobre si respaldan o no la hipótesis, invirtiendo con frecuencia si una hipótesis se considera respaldada: opciones analíticas reconocibles en el preprocesamiento, especificación del modelo, y la inferencia difieren sistemáticamente entre las condiciones de LLM y de persona. Fundamentalmente, los efectos son emph{orientables}: reasignar la personalidad de analista o LLM cambia la distribución de los resultados incluso después de excluir ejecuciones metodológicamente deficientes.
Publicado originalmente en export.arxiv.org el 23 de febrero de 2026.
Ver fuente original
