"¡No hagas eso!": Guía de sistemas encarnados a través de la generación de restricciones basada en modelos de lenguaje grande | Asociación Mexicana del Internet de las Cosas A.C.

Resumen: Los avances recientes en modelos de idiomas grandes (LLM) han estimulado el interés en la navegación robótica que incorpora limitaciones espaciales, matemáticas y condicionales complejas del lenguaje natural al problema de planificación. Dichas limitaciones pueden ser informales pero altamente complejas, lo que hace que sea difícil traducirse en una descripción formal que pueda transmitirse a un algoritmo de planificación. En este artículo, proponemos STPR, un marco de generación de restricciones que utiliza LLM para traducir restricciones (expresadas como instrucciones sobre “ qué no hacer ”) en funciones ejecutables de Python. STPR aprovecha las fuertes capacidades de codificación de la LLM para cambiar la descripción del problema del lenguaje a un código estructurado y transparente, eludiendo así un razonamiento complejo y evitando alucinaciones potenciales. Mostramos que estas funciones generadas por LLM describen con precisión incluso restricciones matemáticas complejas, y las aplican a representaciones de nubes de puntos con algoritmos de búsqueda tradicionales. Los experimentos en un entorno de Gazebo simulado muestran que STPR garantiza el cumplimiento total en varias limitaciones y escenarios, mientras tiene tiempos de ejecución cortos. También verificamos que STPR se pueda usar con LLMS más pequeños específicos de código, lo que lo hace aplicable a una amplia gama de modelos compactos a un costo de inferencia de bajo.

Publicado Originalme en rss.arxiv.org El 5 de junio de 2025.
Ver Fuente Original

“¡No hagas eso!”: Guía de sistemas encarnados a través de la generación de restricciones basada en modelos de lenguaje grande

admin

Aviso de privacidad

Súbete a la ola del IoT

Contacto

Please Share This Compartir este contenido

admin

También podría gustarte

Real: habilidades de evaluación comparativa de grandes modelos de idiomas para transacciones y servicios de vivienda

Basilio: Aprendizaje simbólico simbólico de mejor acción para las políticas de RL compactas en evolución

Navegando por el MIT

Aviso de privacidad

test

Súbete a la ola del IoT

Contacto

Compartir este contenido