Resumen: Partiendo de esta idea, proponemos Test-Time Matching (TTM), un algoritmo iterativo y de mejora automática que impulsa aún más el rendimiento del modelo sin ninguna supervisión externa. TTM ofrece mejoras adicionales no triviales: por ejemplo, TTM permite que SigLIP-B16 supere a GPT-4.1 en MMVP-VLM, estableciendo un nuevo estado de arte. Es importante destacar que TTM sigue siendo ampliamente efectivo incluso en puntos de referencia sin efectos inducidos por métricas o estructuras de grupo, logrando ganancias relativas de hasta el 85,7 % en conjuntos de datos desafiantes como WhatsUp. En 16 variantes de conjuntos de datos que abarcan diversas configuraciones, nuestros experimentos demuestran que TTM mejora constantemente el rendimiento del modelo y avanza la frontera del razonamiento compositivo.
Publicado originalmente en export.arxiv.org el 9 de octubre de 2025.
Ver fuente original