Explicaciones de composición óptimas garantizadas para las neuronas

Resumen:Si bien las neuronas son las unidades básicas de las redes neuronales profundas, aún no está claro qué aprenden y si su conocimiento está alineado con el de los humanos. Las explicaciones compositivas pretenden responder a esta pregunta describiendo la alineación espacial entre las activaciones neuronales y los conceptos a través de reglas lógicas. Estas descripciones lógicas normalmente se calculan mediante una búsqueda de todas las combinaciones de conceptos posibles. Dado que calcular la alineación espacial en todo el espacio de estados es computacionalmente inviable, la literatura comúnmente adopta la búsqueda por haz para restringir el espacio. Sin embargo, la búsqueda de haces no puede proporcionar ninguna garantía teórica de optimización y aún no está claro qué tan cerca están las explicaciones actuales del verdadero óptimo. En este artículo teórico, abordamos esta brecha introduciendo el primer marco para calcular explicaciones compositivas óptimas garantizadas. Específicamente, proponemos: (i) una descomposición que identifica los factores que influyen en la alineación espacial, (ii) una heurística para estimar la alineación en cualquier etapa de la búsqueda y (iii) el primer algoritmo que puede calcular explicaciones compositivas óptimas dentro de un tiempo factible. Utilizando este marco, analizamos las diferencias entre explicaciones óptimas y no óptimas en los entornos más populares para explicaciones compositivas, el dominio de la visión por computadora y las redes neuronales convolucionales. En estos entornos, demostramos que entre el 10 y el 40 por ciento de las explicaciones obtenidas con la búsqueda por haz son subóptimas cuando se trata de conceptos superpuestos. Finalmente, evaluamos una variante de búsqueda de haz guiada por nuestra descomposición y heurística propuestas, mostrando que coincide o mejora el tiempo de ejecución con respecto a los métodos anteriores al tiempo que ofrece una mayor flexibilidad en hiperparámetros y recursos computacionales.

Publicado originalmente en export.arxiv.org el 26 de noviembre de 2025.
Ver fuente original

admin

Aviso de privacidad

Súbete a la ola del IoT

Contacto

Please Share This Compartir este contenido

admin

También podría gustarte

Un formalismo de red tensorial para la IA neurosimbólica

BluePrint Bench: Comparación de inteligencia espacial de LLM, agentes y modelos de imagen

Empoderar a los agentes de LLM con conciencia geoespacial: hacia un razonamiento fundamentado para la respuesta a incendios forestales

Aviso de privacidad

test

Súbete a la ola del IoT

Contacto

Compartir este contenido