DAIL: Más allá de la ambigüedad de las tareas para el aprendizaje por refuerzo condicionado por el lenguaje

Resumen:Comprender el lenguaje natural y seguir instrucciones humanas son capacidades críticas para los agentes inteligentes. Sin embargo, la flexibilidad de las instrucciones lingüísticas induce una ambigüedad sustancial en las tareas condicionadas por el lenguaje, lo que degrada gravemente el rendimiento algorítmico. Para abordar estas limitaciones, presentamos un método novedoso llamado DAIL (Aprendizaje alineado distributivo), que presenta dos componentes clave: política distributiva y alineación semántica. Específicamente, proporcionamos resultados teóricos de que el mecanismo de estimación de la distribución de valores mejora la diferenciabilidad de las tareas. Mientras tanto, el módulo de alineación semántica captura la correspondencia entre trayectorias e instrucciones lingüísticas. Amplios resultados experimentales en puntos de referencia de observación visual y estructurada demuestran que DAIL resuelve eficazmente las ambigüedades de la instrucción, logrando un rendimiento superior a los métodos básicos. Nuestra implementación está disponible en esta URL https.

Publicado originalmente en export.arxiv.org el 22 de octubre de 2025.
Ver fuente original

admin

Aviso de privacidad

Súbete a la ola del IoT

Contacto

Please Share This Compartir este contenido

admin

También podría gustarte

Un teléfono 6G y un ecosistema independiente de datos, medios e inteligencia artificial.

Explorando marcos basados ​​en LLM para el diagnóstico de fallas

El mito del atraco de alta tecnología

Aviso de privacidad

test

Súbete a la ola del IoT

Contacto

Compartir este contenido

Explorando marcos basados en LLM para el diagnóstico de fallas