El sistema de control habilitado para AI ayuda a los drones autónomos a mantenerse en el objetivo en entornos inciertos

Crédito: dominio público CC0
Un dron autónomo que transporta agua para ayudar a extinguir un incendio forestal en la Sierra Nevada podría encontrarse con los giratorios de Santa Ana que amenazan con empujarlo fuera del curso. Adaptarse rápidamente a estas perturbaciones desconocidas a bordo presenta un enorme desafío para el sistema de control de vuelo de los drones.
Para ayudar a que un dron a mantenerse en el objetivo, los investigadores del MIT desarrollaron un nuevo algoritmo de control adaptativo basado en el aprendizaje automático que podría minimizar su desviación de su trayectoria prevista frente a fuerzas impredecibles como vientos raciosos.
El estudio se publica en el servidor ARXIV preimpresión.
A diferencia de los enfoques estándar, la nueva técnica no requiere que la persona que programara el dron autónomo sepa de antemano sobre la estructura de estas perturbaciones inciertas.
En cambio, el modelo de inteligencia artificial del sistema de control aprende todo lo que necesita saber de una pequeña cantidad de datos de observación recopilados de 15 minutos de tiempo de vuelo.
Es importante destacar que la técnica determina automáticamente qué algoritmo de optimización debe usar para adaptarse a las perturbaciones, lo que mejora el rendimiento del seguimiento. Elige el algoritmo que mejor se adapta a la geometría de perturbaciones específicas que enfrenta este dron.
Los investigadores capacitan a su sistema de control para hacer ambas cosas simultáneamente utilizando una técnica llamada meta-learning, que enseña al sistema cómo adaptarse a diferentes tipos de perturbaciones.
Tomados en conjunto, estos ingredientes permiten que su sistema de control adaptativo logre un 50% menos de error de seguimiento de trayectoria que los métodos de referencia en simulaciones y funcionan mejor con nuevas velocidades del viento que no vio durante el entrenamiento.
En el futuro, este sistema de control adaptativo podría ayudar a los drones autónomos de manera más eficiente a entregar parcelas pesadas a pesar de los fuertes vientos o monitorear áreas propensas a incendios de un parque nacional.
“The concurrent learning of these components is what gives our method its strength. By leveraging meta-learning, our controller can automatically make choices that will be best for quick adaptation,” says Navid Azizan, who is the Esther and Harold E. Edgerton Assistant Professor in the MIT Department of Mechanical Engineering and the Institute for Data, Systems, and Society (IDSS), a principal investigator of the Laboratory for Information and Decision Systems (LIDS), and El autor principal del artículo.
Azizan se une al documento por el autor principal Sunbochen Tang, un estudiante graduado en el Departamento de Aeronáutica y Astronáutica, y Haoyuan Sun, un estudiante graduado en el Departamento de Ingeniería Eléctrica y Ciencias de la Computación. La investigación también se presentó en la Conferencia de Learning for Dynamics and Control.
Encontrar el algoritmo correcto
Por lo general, un sistema de control incorpora una función que modela el dron y su entorno, e incluye información existente sobre la estructura de perturbaciones potenciales. Pero en un mundo real lleno de condiciones inciertas, a menudo es imposible diseñar esta estructura de antemano.
Muchos sistemas de control utilizan un método de adaptación basado en un algoritmo de optimización popular, conocido como descenso de gradiente, para estimar las partes desconocidas del problema y determinar cómo mantener el dron lo más cerca posible de su trayectoria objetivo durante el vuelo. Sin embargo, el descenso de gradiente es solo un algoritmo en una familia más grande de algoritmos disponibles para elegir, conocido como descenso de espejo.
“El descenso de espejo es una familia general de algoritmos, y para cualquier problema dado, uno de estos algoritmos puede ser más adecuado que otros. El nombre del juego es cómo elegir el algoritmo particular que es adecuado para su problema. En nuestro método, automatizamos esta elección”, dice Azizan.
En su sistema de control, los investigadores reemplazaron la función que contiene alguna estructura de perturbaciones potenciales con un modelo de red neuronal que aprende a aproximarlos de los datos. De esta manera, no necesitan tener una estructura a priori de las velocidades del viento que este dron podría encontrar de antemano.
Su método también utiliza un algoritmo para seleccionar automáticamente la función de descenso de espejo correcto mientras aprende el modelo de red neuronal de los datos, en lugar de asumir que un usuario ya tiene la función ideal seleccionada. Los investigadores le dan a este algoritmo una variedad de funciones para elegir, y encuentra el que mejor se ajusta al problema en cuestión.
“Elegir una buena función de generación de distancia para construir la adaptación de descenso de espejo derecho es importante para obtener el algoritmo correcto para reducir el error de seguimiento”, agrega Tang.
Aprendiendo a adaptarse
Si bien las velocidades del viento que puede encontrar el dron podría cambiar cada vez que tome el vuelo, la red neuronal y la función del espejo del controlador deben permanecer igual para que no necesiten ser recomputados cada vez.
Para hacer que su controlador sea más flexible, los investigadores usan meta-aprendizaje, enseñándolo a adaptarse mostrándole una variedad de familias de velocidad del viento durante el entrenamiento.
“Nuestro método puede hacer frente a diferentes objetivos porque, utilizando el meta-aprendizaje, podemos aprender una representación compartida a través de diferentes escenarios de manera eficiente de los datos”, explica Tang.
Al final, el usuario alimenta al sistema de control como una trayectoria objetivo y se recalcula continuamente, en tiempo real, cómo el dron debe producir empuje para mantenerlo lo más cerca posible de esa trayectoria mientras acomoda la perturbación incierta que encuentra.
Tanto en simulaciones como en experimentos del mundo real, los investigadores mostraron que su método condujo a un error de seguimiento de trayectoria significativamente menos que los enfoques de línea de base con cada velocidad del viento que probaron.
“Incluso si las perturbaciones del viento son mucho más fuertes de lo que habíamos visto durante el entrenamiento, nuestra técnica muestra que aún puede manejarlas con éxito”, agrega Azizan.
Además, el margen por el cual su método superó las líneas de base creció a medida que las velocidades del viento se intensificaron, lo que demuestra que puede adaptarse a entornos desafiantes.
El equipo ahora está realizando experimentos de hardware para probar su sistema de control en drones reales con diferentes condiciones del viento y otras perturbaciones.
También quieren extender su método para que pueda manejar perturbaciones de múltiples fuentes a la vez. Por ejemplo, cambiar las velocidades del viento podría causar el peso de un paquete que el dron lleva para cambiar en el vuelo, especialmente cuando el dron lleva cargas útiles.
También quieren explorar el aprendizaje continuo, por lo que el dron podría adaptarse a las nuevas perturbaciones sin la necesidad de ser capacitados en los datos que ha visto hasta ahora.
“Navid y sus colaboradores han desarrollado un trabajo innovador que combina el meta-aprendizaje con el control adaptativo convencional para aprender características no lineales de los datos”, dice Babak Hassibi, el profesor de Ingeniería Eléctrica y Ciencias Matemáticas de Mose y Lillian S. Bohn.
“La clave para su enfoque es el uso de técnicas de descenso de espejo que explotan la geometría subyacente del problema de formas en que la técnica anterior no pudo. Su trabajo puede contribuir significativamente al diseño de sistemas autónomos que necesitan operar en entornos complejos e inciertos”.
Más información: Sunbochen Tang et al, meta-aprendizaje para el control adaptativo con descenso de espejo automatizado, ARXIV (2024). Doi: 10.48550/arxiv.2407.20165
Información en la revista: ARXIV proporcionado por el Instituto de Tecnología de Massachusetts
Esta historia se vuelve a publicar por cortesía de MIT News (web.mit.edu/NewsOffice/), un sitio popular que cubre noticias sobre la investigación del MIT, la innovación y la enseñanza.
Cita: el sistema de control habilitado para la AI ayuda a los drones autónomos a mantenerse en el objetivo en entornos inciertos (2025, 10 de junio) recuperado el 10 de junio de 2025 de https://techxplore.com/news/2025-06-ai- habilitado-autónomo-shay.html
Este documento está sujeto a derechos de autor. Además de cualquier trato justo con el propósito de estudio o investigación privada, no se puede reproducir ninguna parte sin el permiso por escrito. El contenido se proporciona solo para fines de información.