Resumen: Los vehículos aéreos no tripulados (UAV) se despliegan cada vez más en defensa, vigilancia y respuesta a desastres, sin embargo, la mayoría de los sistemas permanecen confinados a la autonomía de SAE Nivel 2-3. Su dependencia del control basado en reglas y la IA estrecha restringen la adaptabilidad en misiones dinámicas e inciertas. Los marcos de UAV existentes carecen de razonamiento consciente de contexto, toma de decisiones autónomas e integración a nivel de ecosistema; Críticamente, ninguno aproveche a los agentes del Modelo de Lengua Grande (LLM) con insultos de herramientas para el acceso al conocimiento en tiempo real. Este documento presenta el marco de UAVS de agente, una arquitectura de cinco capas (percepción, razonamiento, acción, integración, aprendizaje) que aumenta los UAV con razonamiento impulsado por LLM, consulta de bases de datos e interacción del sistema de terceros. Un prototipo basado en Ros2 y Gazebo integra la detección de objetos Yolov11 con razonamiento GPT-4 y implementación local de GEMMA-3. En los escenarios simulados de búsqueda y rescate, los UAV de agente lograron una mayor confianza de detección (0.79 frente a 0.72), tasas de detección de persona mejoradas (91% frente a 75%) y una recomendación de acción marcadamente aumentada (92% frente a 4.5%). Estos resultados confirman que la sobrecarga computacional modesta permite niveles cualitativamente nuevos de autonomía e integración del ecosistema.
Publicado Originalme en export.arxiv.org El 17 de septiembre de 2025.
Ver Fuente Original