En este momento estás viendo 
<span class="bsf-rt-reading-time"><span class="bsf-rt-display-label" prefix="Tiempo de lectura"></span> <span class="bsf-rt-display-time" reading_time="1"></span> <span class="bsf-rt-display-postfix" postfix="mins"></span></span><!-- .bsf-rt-reading-time -->DAIL: Más allá de la ambigüedad de las tareas para el aprendizaje por refuerzo condicionado por el lenguaje

DAIL: Más allá de la ambigüedad de las tareas para el aprendizaje por refuerzo condicionado por el lenguaje

  • Autor de la entrada:
  • Categoría de la entrada:Noticias externas

Resumen:Comprender el lenguaje natural y seguir instrucciones humanas son capacidades críticas para los agentes inteligentes. Sin embargo, la flexibilidad de las instrucciones lingüísticas induce una ambigüedad sustancial en las tareas condicionadas por el lenguaje, lo que degrada gravemente el rendimiento algorítmico. Para abordar estas limitaciones, presentamos un método novedoso llamado DAIL (Aprendizaje alineado distributivo), que presenta dos componentes clave: política distributiva y alineación semántica. Específicamente, proporcionamos resultados teóricos de que el mecanismo de estimación de la distribución de valores mejora la diferenciabilidad de las tareas. Mientras tanto, el módulo de alineación semántica captura la correspondencia entre trayectorias e instrucciones lingüísticas. Amplios resultados experimentales en puntos de referencia de observación visual y estructurada demuestran que DAIL resuelve eficazmente las ambigüedades de la instrucción, logrando un rendimiento superior a los métodos básicos. Nuestra implementación está disponible en esta URL https.

Publicado originalmente en export.arxiv.org el 22 de octubre de 2025.
Ver fuente original

admin

Usuario de administración del sitio web