Entrenamiento de agentes de IA incorporados a la morfología: desde desafíos prácticos hasta fundamentos teóricos

Resumen: Si bien la teoría y la práctica a menudo se ven como dominios separados, este artículo muestra que la visión teórica es esencial para superar las barreras de ingeniería del mundo real. Comenzamos con un desafío práctico: capacitar una política de IA incorporada a la morfología que se generaliza a través de diversas morfologías de robots. Formalizamos esto como el problema de entrenamiento de agente incorporado (calor) heterogéneo y demostramos que se reduce a un proceso de decisión de Markov parcialmente observable estructurado (POMDP) que es completado por PSPACE. Este resultado explica por qué las tuberías de aprendizaje de refuerzo actual se descomponen bajo diversidad morfológica, debido a limitaciones de entrenamiento secuencial, acoplamiento de la política de memoria e incompatibilidad de datos. Además, exploramos la adaptación colectiva, una alternativa de aprendizaje distribuida inspirada en los sistemas biológicos. Aunque NEXP complete en teoría, ofrece beneficios significativos de escalabilidad y implementación en la práctica. Este trabajo ilustra cómo la teoría computacional puede iluminar las compensaciones de diseño del sistema y guiar el desarrollo de una IA incorporada más robusta y escalable. Para que los profesionales e investigadores exploren este problema, el código de implementación de este trabajo se ha puesto a disposición del público en esta URL HTTPS

Publicado Originalme en rss.arxiv.org El 4 de junio de 2025.
Ver Fuente Original

admin

Aviso de privacidad

Súbete a la ola del IoT

Contacto

Please Share This Compartir este contenido

admin

También podría gustarte

Planificación categórica difusa: satisfacción autónoma de objetivos con restricciones semánticas graduadas

Metamemoría: recuperar e integrar recuerdos semánticos espaciales para el razonamiento espacial de los robots

Comportamiento antisocial hacia usuarios de modelos de lenguaje grandes: evidencia experimental

Aviso de privacidad

test

Súbete a la ola del IoT

Contacto

Compartir este contenido