En este momento estás viendo 
<span class="bsf-rt-reading-time"><span class="bsf-rt-display-label" prefix="Tiempo de lectura"></span> <span class="bsf-rt-display-time" reading_time="2"></span> <span class="bsf-rt-display-postfix" postfix="mins"></span></span><!-- .bsf-rt-reading-time -->Explicaciones de composición óptimas garantizadas para las neuronas

Explicaciones de composición óptimas garantizadas para las neuronas

  • Autor de la entrada:
  • Categoría de la entrada:Noticias externas

Resumen:Si bien las neuronas son las unidades básicas de las redes neuronales profundas, aún no está claro qué aprenden y si su conocimiento está alineado con el de los humanos. Las explicaciones compositivas pretenden responder a esta pregunta describiendo la alineación espacial entre las activaciones neuronales y los conceptos a través de reglas lógicas. Estas descripciones lógicas normalmente se calculan mediante una búsqueda de todas las combinaciones de conceptos posibles. Dado que calcular la alineación espacial en todo el espacio de estados es computacionalmente inviable, la literatura comúnmente adopta la búsqueda por haz para restringir el espacio. Sin embargo, la búsqueda de haces no puede proporcionar ninguna garantía teórica de optimización y aún no está claro qué tan cerca están las explicaciones actuales del verdadero óptimo. En este artículo teórico, abordamos esta brecha introduciendo el primer marco para calcular explicaciones compositivas óptimas garantizadas. Específicamente, proponemos: (i) una descomposición que identifica los factores que influyen en la alineación espacial, (ii) una heurística para estimar la alineación en cualquier etapa de la búsqueda y (iii) el primer algoritmo que puede calcular explicaciones compositivas óptimas dentro de un tiempo factible. Utilizando este marco, analizamos las diferencias entre explicaciones óptimas y no óptimas en los entornos más populares para explicaciones compositivas, el dominio de la visión por computadora y las redes neuronales convolucionales. En estos entornos, demostramos que entre el 10 y el 40 por ciento de las explicaciones obtenidas con la búsqueda por haz son subóptimas cuando se trata de conceptos superpuestos. Finalmente, evaluamos una variante de búsqueda de haz guiada por nuestra descomposición y heurística propuestas, mostrando que coincide o mejora el tiempo de ejecución con respecto a los métodos anteriores al tiempo que ofrece una mayor flexibilidad en hiperparámetros y recursos computacionales.

Publicado originalmente en export.arxiv.org el 26 de noviembre de 2025.
Ver fuente original

admin

Usuario de administración del sitio web