Coincidencia en el tiempo de prueba: desbloquear el razonamiento compositivo en modelos multimodales

Resumen: Partiendo de esta idea, proponemos Test-Time Matching (TTM), un algoritmo iterativo y de mejora automática que impulsa aún más el rendimiento del modelo sin ninguna supervisión externa. TTM ofrece mejoras adicionales no triviales: por ejemplo, TTM permite que SigLIP-B16 supere a GPT-4.1 en MMVP-VLM, estableciendo un nuevo estado de arte. Es importante destacar que TTM sigue siendo ampliamente efectivo incluso en puntos de referencia sin efectos inducidos por métricas o estructuras de grupo, logrando ganancias relativas de hasta el 85,7 % en conjuntos de datos desafiantes como WhatsUp. En 16 variantes de conjuntos de datos que abarcan diversas configuraciones, nuestros experimentos demuestran que TTM mejora constantemente el rendimiento del modelo y avanza la frontera del razonamiento compositivo.

Publicado originalmente en export.arxiv.org el 9 de octubre de 2025.
Ver fuente original

admin

Aviso de privacidad

Súbete a la ola del IoT

Contacto

Please Share This Compartir este contenido

admin

También podría gustarte

Generalización espontánea de alto orden en la teoría neuronal de las redes

AraModernBERT: inicialización transtokenizada y modelado de codificador de contexto largo para árabe

V-Math: Un enfoque agente para los exámenes de matemáticas de graduación de la escuela secundaria de la escuela secundaria vietnamita

Aviso de privacidad

test

Súbete a la ola del IoT

Contacto

Compartir este contenido