Resumen: Se supone ampliamente que las representaciones no supervisadas son neutrales con respecto a los atributos sensibles cuando esos atributos no se incluyen en el entrenamiento. Demostramos que esta suposición es falsa. Utilizando SOMtime, un método de representación que preserva la topología basado en mapas autoorganizados de alta capacidad, demostramos que atributos sensibles como la edad y los ingresos emergen como ejes latentes dominantes en incrustaciones puramente no supervisadas, incluso cuando se excluyen explícitamente de la entrada. En dos conjuntos de datos del mundo real a gran escala (la Encuesta de Valores Mundiales en cinco países y el conjunto de datos del Censo-Ingresos), SOMtime recupera ordenamientos monótonos alineados con atributos sensibles retenidos, logrando correlaciones de Spearman de hasta 0,85, mientras que PCA y UMAP generalmente permanecen por debajo de 0,23 (con una única excepción que alcanza 0,31), y contra t-SNE y codificadores automáticos que alcanzan como máximo 0,34. Además, la segmentación no supervisada de las incorporaciones de SOMtime produce grupos demográficamente sesgados, lo que demuestra riesgos de equidad en sentido descendente sin ninguna tarea supervisada. Estos hallazgos establecen que la textit{imparcialidad a través del desconocimiento} falla en el nivel de representación para atributos sensibles ordinales y que la auditoría de imparcialidad debe extenderse a los componentes no supervisados de los procesos de aprendizaje automático. Hemos puesto el código a disposición en~ esta URL https
Publicado originalmente en export.arxiv.org el 22 de febrero de 2026.
Ver fuente original
