Home Tecnología El nuevo enfoque permite a los enjambres de drones navegar autónomos de...

El nuevo enfoque permite a los enjambres de drones navegar autónomos de forma autónoma a alta velocidad

22
0

Navegación ágil basada en la visión a través de entornos desordenados utilizando un controlador de red neuronal de extremo a extremo entrenado con física diferenciable. Crédito: Nature Machine Intelligence (2025). Doi: 10.1038/s42256-025-01048-0

Los vehículos aéreos no tripulados (UAV), comúnmente conocidos como drones, ahora se usan ampliamente en todo el mundo para abordar varias tareas del mundo real, incluida la filmación de videos para diversos fines, monitoreo de cultivos u otros entornos de arriba, evaluar las zonas de desastres y la realización de operaciones militares. A pesar de su uso generalizado, la mayoría de los drones existentes deben ser operados plenamente o parcialmente por agentes humanos.

Además, muchos drones no pueden navegar en ambientes desordenados, llenos o desconocidos sin colisionar con objetos cercanos. Aquellos que pueden navegar por estos entornos generalmente dependen de componentes costosos o voluminosos, como sensores avanzados, unidades de procesamiento de gráficos (GPU) o sistemas de comunicación inalámbrica.

Investigadores de la Universidad de Shanghai Jiao Tong han introducido recientemente un nuevo enfoque inspirado en insectos que podría permitir a los equipos de múltiples drones navegar autónomos de forma autónoma mientras se mueve a alta velocidad. Su enfoque propuesto, introducido en un artículo publicado En Nature Machine Intelligence, se basa tanto en un algoritmo de aprendizaje profundo como de principios de física central.

“Nuestra investigación se inspiró en las increíbles capacidades de vuelo de pequeños insectos como las moscas”, dijeron a Tech Xplore, el profesor Daning Zou y el profesor Weiyao Lin, autores co-senosos del periódico. “Siempre nos sorprendió cómo las criaturas tan pequeñas, con solo un cerebro pequeño y una sensación limitada, pueden realizar maniobras ágiles e inteligentes, evitando obstáculos, flotar en el aire o perseguir presas.

“Replicar ese nivel de control de vuelo ha sido durante mucho tiempo un sueño y un gran desafío en la robótica. Requiere una percepción, planificación y control estrechamente integrada, todo con un cálculo a bordo muy limitado, al igual que en el cerebro de insectos”.

Los enfoques computacionales más comunes para controlar el vuelo de múltiples drones desglosan la tarea de navegación autónoma en módulos separados, como la estimación de estado, el mapeo, la planificación de rutas, la generación de trayectoria y los módulos de control. Si bien abordar estas subasinas por separado puede ser efectivo, a veces provoca la acumulación de errores en diferentes módulos e introduce latencia en las respuestas de los drones. En otras palabras, puede hacer que los drones reaccionen más lentamente cuando se acercan a los obstáculos, lo que puede aumentar el riesgo de colisiones en entornos dinámicos y desordenados.

Grabaciones originales de experimentos de enjambre. Crédito: Nature Machine Intelligence (2025). Doi: 10.1038/s42256-025-01048-0

“El objetivo principal de nuestra investigación era explorar si una red neuronal artificial ligera (ANN) podría reemplazar esta tubería clásica con una política compacta de extremo a extremo”, dijeron el profesor Zou y el profesor Lin.

“Esta red toma datos del sensor como entrada y genera directamente las acciones de control, un paradigma que refleja cómo las moscas usan un pequeño número de neuronas para producir un comportamiento complejo e inteligente. Buscamos no solo coincidir con la elegancia biológica, sino para demostrar que el minimalismo en la detección y el cálculo aún puede producir un vuelo autónomo de alta rendimiento”.

El nuevo sistema desarrollado por los investigadores se basa principalmente en una red neuronal artificial ligera recientemente desarrollada que puede generar comandos de control para un vehículo aéreo cuadrotor basado en un mapa de profundidad de resolución ultra baja 12×16. Si bien la definición de los mapas alimentados al algoritmo es baja, se descubrió que era suficiente para que la red diera sentido a su entorno circundante y planifique efectivamente las acciones de los vehículos aéreos.

“Entrenamos esta red en un simulador personalizado compuesto por formas geométricas simples (cubos, elipsoides, cilindros y planos, lo que nos permite generar entornos diversos pero estructurados”, explicó el profesor Zou y el profesor Lin. “Nuestro proceso de capacitación es altamente eficiente, gracias a una tubería diferenciable basada en la física. Admite modos de entrenamiento de un solo agente y de múltiples agentes: en el entorno de múltiples agentes, otros drones se tratan como obstáculos dinámicos durante el aprendizaje”.

Una ventaja clave del enfoque de navegación de vehículos multiabarros desarrollados por los investigadores es que se basa en una red neuronal profunda altamente compacta y ligera que tiene solo tres capas convolucionales. Los investigadores lo probaron en una placa informática integrada que cuesta solo $ 21 y descubrieron que funcionaba sin problemas y de eficiencia energética.

“La capacitación converge en solo 2 horas en una GPU RTX 4090, que es notablemente rápida para el aprendizaje de políticas”, dijeron el profesor Zou y el profesor Lin. “Nuestro sistema también admite naturalmente la navegación de múltiples robots sin ninguna planificación centralizada o comunicación explícita, lo que permite la implementación escalable en escenarios de enjambre”.

La red neuronal del equipo se ejecuta en un tablero de desarrollo de gama baja que cuesta solo 21 $. Crédito: Zhang et al.

Cuando revisaron la literatura anterior en el campo, los investigadores descubrieron que muchos algoritmos de aprendizaje profundo para la navegación de drones no se generalizaron bien en los escenarios del mundo real. Esto a menudo se debe a que no tienen en cuenta los obstáculos o cambios inesperados en el medio ambiente, y necesitan ser capacitados con grandes cantidades de datos de vuelo etiquetados por expertos humanos.

“Nuestro hallazgo más importante es que integrar el modelo de física del cuadrotor directamente en el proceso de entrenamiento puede mejorar significativamente tanto la eficiencia de entrenamiento como el rendimiento del mundo real, en términos de robustez y agilidad”, dijeron el profesor Zou y el profesor Lin.

“Esta técnica, conocida como aprendizaje físico diferenciable, no fue inventada por nosotros, pero somos los primeros en extenderla y aplicarla con éxito al control cuadrotoral del mundo real. A través de esta investigación, también llegamos a tres ideas inesperadas pero poderosas, sin poder de remodelar cómo pensamos sobre la inteligencia, los modelos y la percepción en Robotics”.

Los hallazgos prometedores alcanzados por el Prof. Zou, el Prof. Lin y sus colegas demuestran el potencial de los pequeños modelos basados en redes neuronales artificiales para abordar tareas de navegación complejas. Los investigadores mostraron que estos modelos podrían ser más efectivos de lo que a menudo se percibe y también pueden ayudar a comprender cómo funcionan los modelos más grandes.

“Así como la neurociencia hizo su progreso temprano a través de la mosca de la fruta, cuyos circuitos neuronales simples ayudaron a desbloquear ideas fundamentales, los modelos pequeños nos dan una visión más clara de cómo se combinan la percepción, la toma de decisiones y el control”, dijeron el profesor Zou y el profesor Lin. “En nuestro caso, un modelo con menos de 2 MB de parámetros habilitó la coordinación de múltiples agentes sin ninguna comunicación, mostrando cómo la simplicidad puede conducir a la inteligencia emergente”.

En particular, el modelo liviano desarrollado por los investigadores se desempeñó bien a pesar de ser entrenado en un entorno simulado. Esto está en marcado contraste con muchos modelos previamente desarrollados que requieren cantidades sustanciales de datos marcados con expertos.

Reproducción de múltiples vistas del experimento de enjambre basado en la visión interior. Crédito: Nature Machine Intelligence (2025). Doi: 10.1038/s42256-025-01048-0

“Aprendimos que la inteligencia no tiene que depender de conjuntos de datos masivos”, dijeron los investigadores. “Entrenamos por completo a nuestra política en la simulación, sin datos a escala de Internet, registros precolectados o demostraciones hechas a mano, utilizando solo unas pocas tareas básicas y entornos geométricos impulsados por un motor físico diferenciable. Esto desafía la suposición común de que” más datos siempre es mejor “y sugiere que el alineación estructural y los priors físicos embrujados pueden importar más que el volumen de datos humados”.

En general, los resultados de este estudio reciente sugieren que las redes neuronales guiadas por principios físicos básicos podrían lograr mejores resultados que las redes capacitadas en millones de imágenes, mapas u otros datos etiquetados. Además, los investigadores encontraron que incluso una imagen de profundidad de baja definición puede usarse para guiar con precisión el comportamiento de los robots.

“Al igual que la mosca de la fruta, cuya visión se limita a los ojos compuestos de baja resolución, pero maneja las increíbles hazañas aéreas, utilizamos imágenes de profundidad de 12 × 16 píxeles para controlar drones que vuelan a velocidades de hasta 20 m/s”, dijeron el profesor Zou y el profesor Lin. “Esto respalda una hipótesis audaz: el rendimiento de la navegación puede depender más de la comprensión interna del agente del mundo físico que de la fidelidad del sensor solo”.

En el futuro, el enfoque desarrollado por el Prof. Zou, el Prof. Lin y sus colegas podrían desplegarse en más tipos de vehículos aéreos y probarse en escenarios específicos del mundo real. Eventualmente, podría ayudar a ampliar las tareas que pueden abordarse por drones de peso ultra ligero, por ejemplo, permitiéndoles tomar selfies o competir automáticamente en las competiciones de carreras. El enfoque también podría resultar útil para transmitir deportes u otros eventos, para buscar edificios colapsados durante las operaciones de búsqueda y rescate, y para inspeccionar los almacenes desordenados.

“Actualmente estamos explorando el uso del flujo óptico en lugar de mapas de profundidad para un vuelo completamente autónomo”, agregaron el profesor Zou y el Prof. Lin. “El flujo óptico proporciona señales de movimiento fundamentales y se ha estudiado durante mucho tiempo en neurociencia como un componente clave de la visión de insectos.

“Al usarlo, esperamos acercarnos aún más a imitar las estrategias naturales que los insectos usan para la navegación. Otra dirección importante que estamos seguiendo es la interpretabilidad de los sistemas de aprendizaje de extremo a extremo”.

Aunque se encontró que la red neuronal ligera del equipo funciona notablemente bien en los experimentos del mundo real, cómo funcionan estos resultados prometedores aún no se entiende completamente. Como parte de sus próximos estudios, el Prof. Zou y el Prof. Lin esperan arrojar más luz sobre las representaciones internas de la red, lo que también podría ofrecer información sobre cómo los insectos procesan sus alrededores y planifican sus acciones.

Escrito para usted por nuestro autor Ingrid Fadellieditado por Gaby Clarky verificado y revisado por Andrew Zinin—Este artículo es el resultado de un trabajo humano cuidadoso. Confiamos en lectores como usted para mantener vivo el periodismo científico independiente. Si este informe le importa, considere un donación (especialmente mensual). Obtendrá una cuenta sin anuncios como agradecimiento.

Más información: Aprender el vuelo ágil basado en la visión a través de una física diferenciable. Nature Machine Intelligence (2025). Doi: 10.1038/s42256-025-01048-0.

© 2025 Science X Network

Cita: El nuevo enfoque permite a los enjambres de drones navegar autónomos de forma autónoma a alta velocidad (2025, 21 de julio) recuperado el 21 de julio de 2025 de https://techxplore.com/news/2025-07-proching-drone-swarms-autonomía-complex.html

Este documento está sujeto a derechos de autor. Además de cualquier trato justo con el propósito de estudio o investigación privada, no se puede reproducir ninguna parte sin el permiso por escrito. El contenido se proporciona solo para fines de información.

Fuente de noticias