En este momento estás viendo 
<span class="bsf-rt-reading-time"><span class="bsf-rt-display-label" prefix="Tiempo de lectura"></span> <span class="bsf-rt-display-time" reading_time="1"></span> <span class="bsf-rt-display-postfix" postfix="mins"></span></span><!-- .bsf-rt-reading-time -->Aprendizaje de imitación interactiva de robot con mecanismo de intervención adaptativa

Aprendizaje de imitación interactiva de robot con mecanismo de intervención adaptativa

  • Autor de la entrada:
  • Categoría de la entrada:Noticias externas

Resumen: El aprendizaje de imitación interactiva (IIL) permite a los agentes adquirir los comportamientos deseados a través de las intervenciones humanas, pero los métodos actuales imponen altas demandas cognitivas a los supervisores humanos. Proponemos el mecanismo de intervención adaptativa (AIM), un nuevo algoritmo IIL activado por el robot que aprende un criterio adaptativo para solicitar manifestaciones humanas. AIM utiliza una función Q proxy para imitar la regla de intervención humana y ajusta las solicitudes de intervención en función de la alineación entre las acciones de agente y humano. Al asignar altos valores Q cuando el agente se desvía del experto y disminuyendo estos valores a medida que el agente se vuelve competente, la función Q proxy permite al agente evaluar la alineación en tiempo real con el experto y solicitar asistencia cuando sea necesario. Nuestros experimentos expertos en el bucle revelan que AIM reduce significativamente los esfuerzos de monitoreo de expertos en tareas de control continuas y discretas. En comparación con la daga de base basada en la incertidumbre, nuestro método logra una mejora del 40% en términos de costo de adquisición humana y eficiencia de aprendizaje. Además, AIM identifica efectivamente los estados críticos de seguridad para la asistencia experta, recopilando así demostraciones de expertos de mayor calidad y reduciendo los datos generales de expertos y las interacciones ambientales necesarias. El código y el video de demostración están disponibles en esta URL HTTPS.

Publicado Originalme en rss.arxiv.org El 11 de junio de 2025.
Ver Fuente Original

admin

Usuario de administración del sitio web