Resumen: Examinamos investigaciones recientes que pregunta si los sistemas de IA actuales pueden estar desarrollando una capacidad de “esquema” (persiguiendo objetivos desalineados de manera encubierta y estratégica). Comparamos las prácticas de investigación actuales en este campo con las adoptadas en la década de 1970 para probar si los primates no humanos podrían dominar el lenguaje natural. Argumentamos que hay lecciones que aprender de ese esfuerzo de investigación histórica, que se caracterizó por una extensión excesiva de los rasgos humanos a otros agentes, una dependencia excesiva de la anécdota y el análisis descriptivo, y una falta de articulación de un marco teórico fuerte para la investigación. Recomendamos que la investigación sobre el esquema de la IA busque activamente evitar estas dificultades. Esbozamos algunos pasos concretos que se pueden tomar para que este programa de investigación avance de una manera productiva y científicamente rigurosa.
Publicado Originalme en export.arxiv.org El 7 de julio de 2025.
Ver Fuente Original