ITNet: una transformación integral que se puede aprender y que incluye convolución, atención y recurrencia
Resumen: Las redes convolucionales, las redes recurrentes y los transformadores codifican diferentes sesgos inductivos (localidad, memoria secuencial e interacción por pares dependiente del contenido) y se han mantenido matemáticamente distintos desde sus inicios.
Leer más →