Algunas veces el mundo no es justo: violar la equidad mediante el uso de mapas autoorganizados

Resumen: Se supone ampliamente que las representaciones no supervisadas son neutrales con respecto a los atributos sensibles cuando esos atributos no se incluyen en el entrenamiento. Demostramos que esta suposición es falsa. Utilizando SOMtime, un método de representación que preserva la topología basado en mapas autoorganizados de alta capacidad, demostramos que atributos sensibles como la edad y los ingresos emergen como ejes latentes dominantes en incrustaciones puramente no supervisadas, incluso cuando se excluyen explícitamente de la entrada. En dos conjuntos de datos del mundo real a gran escala (la Encuesta de Valores Mundiales en cinco países y el conjunto de datos del Censo-Ingresos), SOMtime recupera ordenamientos monótonos alineados con atributos sensibles retenidos, logrando correlaciones de Spearman de hasta 0,85, mientras que PCA y UMAP generalmente permanecen por debajo de 0,23 (con una única excepción que alcanza 0,31), y contra t-SNE y codificadores automáticos que alcanzan como máximo 0,34. Además, la segmentación no supervisada de las incorporaciones de SOMtime produce grupos demográficamente sesgados, lo que demuestra riesgos de equidad en sentido descendente sin ninguna tarea supervisada. Estos hallazgos establecen que la textit{imparcialidad a través del desconocimiento} falla en el nivel de representación para atributos sensibles ordinales y que la auditoría de imparcialidad debe extenderse a los componentes no supervisados de los procesos de aprendizaje automático. Hemos puesto el código a disposición en~ esta URL https

Publicado originalmente en export.arxiv.org el 22 de febrero de 2026.
Ver fuente original

admin

Aviso de privacidad

Súbete a la ola del IoT

Contacto

Please Share This Compartir este contenido

admin

También podría gustarte

Representación de patrones de solicitud con PDL: Estudio de caso del agente de cumplimiento

Herramienta de escaneo TAI: una herramienta basada en el trapo con información minimalista para la autoevaluación de IA confiable

Sistema de modelo de lenguaje grande aumentado para recuperación para contraindicaciones de drogas integrales

Aviso de privacidad

test

Súbete a la ola del IoT

Contacto

Compartir este contenido