En este momento estás viendo 
<span class="bsf-rt-reading-time"><span class="bsf-rt-display-label" prefix="Tiempo de lectura"></span> <span class="bsf-rt-display-time" reading_time="1"></span> <span class="bsf-rt-display-postfix" postfix="mins"></span></span><!-- .bsf-rt-reading-time -->Entrenamiento de agentes de IA incorporados a la morfología: desde desafíos prácticos hasta fundamentos teóricos

Entrenamiento de agentes de IA incorporados a la morfología: desde desafíos prácticos hasta fundamentos teóricos

  • Autor de la entrada:
  • Categoría de la entrada:Noticias externas

Resumen: Si bien la teoría y la práctica a menudo se ven como dominios separados, este artículo muestra que la visión teórica es esencial para superar las barreras de ingeniería del mundo real. Comenzamos con un desafío práctico: capacitar una política de IA incorporada a la morfología que se generaliza a través de diversas morfologías de robots. Formalizamos esto como el problema de entrenamiento de agente incorporado (calor) heterogéneo y demostramos que se reduce a un proceso de decisión de Markov parcialmente observable estructurado (POMDP) ​​que es completado por PSPACE. Este resultado explica por qué las tuberías de aprendizaje de refuerzo actual se descomponen bajo diversidad morfológica, debido a limitaciones de entrenamiento secuencial, acoplamiento de la política de memoria e incompatibilidad de datos. Además, exploramos la adaptación colectiva, una alternativa de aprendizaje distribuida inspirada en los sistemas biológicos. Aunque NEXP complete en teoría, ofrece beneficios significativos de escalabilidad y implementación en la práctica. Este trabajo ilustra cómo la teoría computacional puede iluminar las compensaciones de diseño del sistema y guiar el desarrollo de una IA incorporada más robusta y escalable. Para que los profesionales e investigadores exploren este problema, el código de implementación de este trabajo se ha puesto a disposición del público en esta URL HTTPS

Publicado Originalme en rss.arxiv.org El 4 de junio de 2025.
Ver Fuente Original

admin

Usuario de administración del sitio web