Resumen:En este trabajo, presentamos LOGIC (Logit-Space Integration for Contextual Biasing), un marco eficiente y robusto que opera directamente en la capa de decodificación. A diferencia de las indicaciones, LOGIC desacopla la inyección de contexto del procesamiento de entrada, lo que garantiza una complejidad de tiempo constante en relación con la duración de la solicitud. Amplios experimentos utilizando el modelo Phi-4-MM en 11 ubicaciones multilingües demuestran que LOGIC logra una reducción relativa promedio del 9 % en el WER de la entidad con un aumento insignificante del 0,30 % en la tasa de falsas alarmas.
Publicado originalmente en export.arxiv.org el 22 de enero de 2026.
Ver fuente original
