Resumen: Los modelos analógicos sirven como sustitutos públicos, lo que permite una amplia participación en la verificación de seguridad, la investigación de interpretabilidad y la transparencia algorítmica sin obligar a los laboratorios a revelar sus modelos a gran escala. Investigaciones recientes demuestran que los métodos de seguridad e interpretabilidad desarrollados utilizando estos modelos más pequeños se generalizan eficazmente a sistemas de escala fronteriza. Al permitir que la comunidad de investigación en general investigue e innove directamente sobre análogos accesibles, nuestra política reduce sustancialmente la carga regulatoria y acelera los avances en seguridad.
Este mandato promete costos adicionales mínimos, aprovechando recursos reutilizables como datos e infraestructura, al tiempo que contribuye significativamente al bien público. Nuestra esperanza no es solo que se adopte esta política, sino que ilustre un principio más amplio que respalda la investigación fundamental en el aprendizaje automático: una comprensión más profunda de los modelos relaja el equilibrio entre seguridad e innovación y nos permite tener más de ambos.
Publicado originalmente en export.arxiv.org el 16 de octubre de 2025.
Ver fuente original
