En este momento estás viendo 
<span class="bsf-rt-reading-time"><span class="bsf-rt-display-label" prefix="Tiempo de lectura"></span> <span class="bsf-rt-display-time" reading_time="1"></span> <span class="bsf-rt-display-postfix" postfix="mins"></span></span><!-- .bsf-rt-reading-time -->“¡No hagas eso!”: Guía de sistemas encarnados a través de la generación de restricciones basada en modelos de lenguaje grande

“¡No hagas eso!”: Guía de sistemas encarnados a través de la generación de restricciones basada en modelos de lenguaje grande

  • Autor de la entrada:
  • Categoría de la entrada:Noticias externas

Resumen: Los avances recientes en modelos de idiomas grandes (LLM) han estimulado el interés en la navegación robótica que incorpora limitaciones espaciales, matemáticas y condicionales complejas del lenguaje natural al problema de planificación. Dichas limitaciones pueden ser informales pero altamente complejas, lo que hace que sea difícil traducirse en una descripción formal que pueda transmitirse a un algoritmo de planificación. En este artículo, proponemos STPR, un marco de generación de restricciones que utiliza LLM para traducir restricciones (expresadas como instrucciones sobre “ qué no hacer ”) en funciones ejecutables de Python. STPR aprovecha las fuertes capacidades de codificación de la LLM para cambiar la descripción del problema del lenguaje a un código estructurado y transparente, eludiendo así un razonamiento complejo y evitando alucinaciones potenciales. Mostramos que estas funciones generadas por LLM describen con precisión incluso restricciones matemáticas complejas, y las aplican a representaciones de nubes de puntos con algoritmos de búsqueda tradicionales. Los experimentos en un entorno de Gazebo simulado muestran que STPR garantiza el cumplimiento total en varias limitaciones y escenarios, mientras tiene tiempos de ejecución cortos. También verificamos que STPR se pueda usar con LLMS más pequeños específicos de código, lo que lo hace aplicable a una amplia gama de modelos compactos a un costo de inferencia de bajo.

Publicado Originalme en rss.arxiv.org El 5 de junio de 2025.
Ver Fuente Original

admin

Usuario de administración del sitio web