Resumen:Comprender el lenguaje natural y seguir instrucciones humanas son capacidades críticas para los agentes inteligentes. Sin embargo, la flexibilidad de las instrucciones lingüísticas induce una ambigüedad sustancial en las tareas condicionadas por el lenguaje, lo que degrada gravemente el rendimiento algorítmico. Para abordar estas limitaciones, presentamos un método novedoso llamado DAIL (Aprendizaje alineado distributivo), que presenta dos componentes clave: política distributiva y alineación semántica. Específicamente, proporcionamos resultados teóricos de que el mecanismo de estimación de la distribución de valores mejora la diferenciabilidad de las tareas. Mientras tanto, el módulo de alineación semántica captura la correspondencia entre trayectorias e instrucciones lingüísticas. Amplios resultados experimentales en puntos de referencia de observación visual y estructurada demuestran que DAIL resuelve eficazmente las ambigüedades de la instrucción, logrando un rendimiento superior a los métodos básicos. Nuestra implementación está disponible en esta URL https.
Publicado originalmente en export.arxiv.org el 22 de octubre de 2025.
Ver fuente original
