Resumen: Este documento presenta un método para clasificar los violines como reducido o no reducido en función de sus líneas de contorno. Estudiamos un corpus de 25 instrumentos cuyas mallas geométricas 3D se adquirieron mediante fotogrametría. Para cada instrumento, extraemos 10-20 líneas de contorno espaciadas regularmente cada milímetro.
Leer más →
Resumen: Los modelos de idiomas grandes permiten interacciones dinámicas del juego pero luchan con los sistemas comerciales gobernados por reglas. Las implementaciones actuales sufren violaciones de reglas, como alucinaciones de elementos y errores de cálculo, que erosionan la confianza del jugador.
Leer más →
Resumen: La optimización de preferencias directas (DPO) se ha convertido en una alternativa popular y eficiente al modelado de recompensas y al aprendizaje de refuerzo para alinear modelos lingüísticos con preferencias humanas. A pesar de su éxito empírico, las propiedades teóricas y las limitaciones intrínsecas de DPO permanecen subexploradas.
Leer más →