Resumen: motivamos y describimos un programa para una teoría formal de la medición de la inteligencia artificial. Argumentamos que formalizar la medición para la IA permitirá a los investigadores, profesionales y reguladores: (i) hacer comparaciones entre los sistemas y los métodos de evaluación aplicados a ellos; (ii) conectar evaluaciones de IA fronteriza con técnicas establecidas de análisis de riesgos cuantitativos extraídos de la ciencia de la ingeniería y la seguridad; y (iii) en primer plano cómo lo que cuenta como capacidad de IA depende de las operaciones y escalas de medición que elegimos usar. Bosquejamos una pila de medición en capas, distinguimos los observables directos de los indirectos y señalamos cómo estos ingredientes proporcionan una vía hacia una taxonomía unificable y calibible de los fenómenos de IA.
Publicado Originalme en export.arxiv.org El 8 de julio de 2025.
Ver Fuente Original