Resumen: Los sistemas de IA pueden automatizar cada vez más los flujos de trabajo científicos, pero el razonamiento que vincula la evidencia previa, las ideas generadas, los experimentos y las afirmaciones finales a menudo permanece implícito dentro de la inferencia del modelo. Aquí presentamos Xcientist, un arnés de investigación que externaliza la síntesis de la investigación y la validación experimental en procesos inspeccionables y regidos por contratos. Xcientist organiza evidencia bibliográfica, estados de ideas, planes de implementación, registros de ablación y rastros de reparación como artefactos de investigación persistentes, de modo que los mecanismos generados puedan fundamentarse, ejecutarse, probarse y revisarse sin perder su base probatoria. Identificamos la deriva de reclamos como un modo de falla de la investigación automatizada, donde los artefactos ejecutables ya no respaldan el mecanismo reclamado originalmente. A través de sistemas de memoria sin entrenamiento, pronóstico de tráfico estructurado en gráficos y redes neuronales basadas en física de múltiples escalas, Xcientist preserva trayectorias rastreables desde la formulación del problema hasta el diseño, la validación y la revisión limitada del mecanismo. Estos resultados sugieren que los científicos de IA deberían ser evaluados no sólo por sus artefactos finales, sino también por si sus procesos de síntesis y validación siguen siendo atribuibles, inspeccionables y científicamente responsables.
Publicado originalmente en export.arxiv.org el 17 de junio de 2026.
Ver fuente original
