En este momento estás viendo 
<span class="bsf-rt-reading-time"><span class="bsf-rt-display-label" prefix="Tiempo de lectura"></span> <span class="bsf-rt-display-time" reading_time="1"></span> <span class="bsf-rt-display-postfix" postfix="mins"></span></span><!-- .bsf-rt-reading-time -->Coincidencia en el tiempo de prueba: desbloquear el razonamiento compositivo en modelos multimodales

Coincidencia en el tiempo de prueba: desbloquear el razonamiento compositivo en modelos multimodales

  • Autor de la entrada:
  • Categoría de la entrada:Noticias externas

Resumen: Partiendo de esta idea, proponemos Test-Time Matching (TTM), un algoritmo iterativo y de mejora automática que impulsa aún más el rendimiento del modelo sin ninguna supervisión externa. TTM ofrece mejoras adicionales no triviales: por ejemplo, TTM permite que SigLIP-B16 supere a GPT-4.1 en MMVP-VLM, estableciendo un nuevo estado de arte. Es importante destacar que TTM sigue siendo ampliamente efectivo incluso en puntos de referencia sin efectos inducidos por métricas o estructuras de grupo, logrando ganancias relativas de hasta el 85,7 % en conjuntos de datos desafiantes como WhatsUp. En 16 variantes de conjuntos de datos que abarcan diversas configuraciones, nuestros experimentos demuestran que TTM mejora constantemente el rendimiento del modelo y avanza la frontera del razonamiento compositivo.

Publicado originalmente en export.arxiv.org el 9 de octubre de 2025.
Ver fuente original

admin

Usuario de administración del sitio web