El micrófono 3D de sensor único permite a los robots localizar a los humanos en entornos ruidosos

3DAR (rango acústico 3d) desarrollado por el equipo de investigación del profesor Sung-Hoon Ahn en el Departamento de Ingeniería Mecánica de la Universidad Nacional de Seúl. Crédito: Colegio de Ingeniería de la Universidad Nacional de Seúl
Un equipo de investigación ha desarrollado una nueva tecnología auditiva que permite el reconocimiento de posiciones humanas utilizando un solo micrófono. Esta tecnología facilita la interacción basada en el sonido entre humanos y robots, incluso en entornos de fábrica ruidosos.
El equipo de investigación ha implementado con éxito el primer sensor auditivo 3D del mundo que “ve espacio con oídos” a través de la localización de la fuente de sonido y las tecnologías de comunicación acústica.
Los resultados de la investigación se publican en la revista Robótica y la fabricación integrada por computadora. El equipo incluye el grupo del profesor de la Facultad de Ingeniería de la Universidad Nacional de Seúl, Sung-hoon Ahn, grupo del Departamento de Ingeniería Mecánica.
En la configuración de rescate industrial y de desastres, “Sound” sirve como una señal crucial. Incluso en situaciones en las que los sensores visuales o la comunicación electromagnética se vuelven ineficaces debido a las altas temperaturas, el polvo, el humo, la oscuridad u obstáculos, las ondas de sonido aún pueden transmitir información vital.
Sin embargo, las tecnologías de detección acústica existentes tienen limitaciones en la precisión o requieren configuraciones de equipos complejos, lo que hace que las aplicaciones industriales prácticas sean desafiantes. En consecuencia, el sonido no se ha utilizado completamente como un recurso de detección a pesar de su potencial.
Particularmente en entornos de alto ruido como las fábricas, se necesitan tecnologías avanzadas de detección acústica, ya que identificar con precisión las posiciones humanas o permitir que los robots reconozcan los comandos verbales es extremadamente difícil. Además, los métodos de comunicación tradicionales enfrentan desafíos en entornos que carecen de infraestructura de red, destacando la necesidad de nuevas tecnologías de comunicación robot a robot que utilizan el sonido.
(Desde la izquierda) Principio operativo del mecanismo de cancelación de fase utilizando una metastructura acústica, mejora de la directividad de sensor único (rendimiento de formación de haz) y detección acústica 3D mediante rotación (3DAR). Crédito: robótica y fabricación integrada por computadora, publicada originalmente en robótica y fabricación integrada por computadora
Al abordar estos problemas fundamentales, el equipo de investigación desarrolló el primer sensor auditivo 3D basado en la metaestructura del mundo capaz de reconocimiento de posición utilizando un solo sensor. Este sensor integra dos tecnologías centrales: una tecnología de percepción acústica 3D que estima las posiciones 3D de humanos u objetos incluso en entornos ruidosos, y una tecnología de comunicación dual basada en ondas de sonido que permite nuevos métodos de interacción entre humanos y robots, así como entre robots.
El equipo del profesor Ahn se centró en los mecanismos biológicos de los murciélagos y los delfines, que reconocen su entorno y se comunican únicamente a través del sonido. Dirigieron particularmente a diseñar la capacidad auditiva de “escuchar selectivamente sonidos desde direcciones específicas”, lo que permite el aislamiento de los sonidos deseados en medio de un ruido complejo.
Para lograr esto, diseñaron un mecanismo de cancelación de fase basado en metaestructura que ajusta artificialmente la fase de las ondas de sonido que llegan desde diferentes rutas, amplificando los sonidos desde direcciones específicas mientras cancela otros.
Al combinar este mecanismo con un solo micrófono y un dispositivo de rotación, el equipo implementó la funcionalidad de seguimiento de la fuente de sonido 3D, que se puede lograr con sistemas múltiples de sensores múltiples, en un solo sensor. Llamaron a este sistema 3DAR (rango acústico 3D).
Además, inspirados en los principios de comunicación de doble frecuencia de los Dolphins, los investigadores diseñaron un canal acústico dual que separa los rangos de frecuencia audibles e inaudibles. Esta estructura permite a los humanos y robots comunicarse usando frecuencias audibles (sonidos que los humanos pueden escuchar), mientras que los robots se comunican entre ellos utilizando frecuencias inaudibles (sonidos que los humanos no pueden escuchar). Este diseño minimiza la interferencia y proporciona rutas de comunicación independientes entre los robots, facilitando escenarios de colaboración más complejos en entornos industriales.
Estas dos tecnologías se integran en un solo sistema de sensores auditivos 3D de metaestructura, que el equipo de investigación implementó con éxito en una plataforma de robot real. Las pruebas de campo se realizaron en entornos de fábrica y cotidianos. En particular, un robot cuadrúpedo equipado con este sistema interactuó con éxito con los humanos a través del sonido, y detectó ubicaciones de fuga de gas a través del sonido.
Se anticipa que la tecnología desarrollada en esta investigación es ampliamente aplicable en varios campos, incluido el seguimiento de los puestos de trabajadores dentro de las fábricas, permitiendo la colaboración humana-robot basada en la voz y ayudar a los robots a reconocer y responder a las llamadas de rescate humano durante los desastres. Además, el diseño compacto y de bajo costo del sensor en comparación con los sistemas existentes lo hace fácilmente desplegable en entornos industriales.
(Desde la izquierda) Profesor Sung-Hoon Ahn (autor correspondiente), Ph.D. Candidato Semin Ahn (primer autor), Ph.D. Candidato Jun Heo (coautor). y el estudiante del maestro Jae-hoon Kim (coautor), todo del Departamento de Ingeniería Mecánica de SNU. Crédito: Colegio de Ingeniería de la Universidad Nacional de Seúl
Se espera que su utilidad sea en particular en las plantas de fabricación autónomas a base de células. Al aprovechar esta tecnología, el seguimiento en tiempo real de los puestos de trabajadores puede evitar colisiones con robots y la comunicación con los robots solo a través del sonido, sin gestos o botones, puede mejorar la libertad física de los trabajadores, lo que permite una colaboración más eficiente.
Además, la comunicación de robot a robot a través del sonido, sin depender de las redes tradicionales, permite una coordinación flexible y orgánica entre múltiples robots sin infraestructura de comunicación compleja.
También se proyecta que la tecnología sea valiosa para el monitoreo de fábrica no tripulada las 24 horas. Puede detectar y localizar automáticamente sonidos indicativos de fugas de tuberías, anomalías de maquinaria o accidentes de trabajadores, lo que permite respuestas inmediatas. Además, debido a su diseño de bajo costo y compacto basado en un solo sensor, el sistema posee versatilidad para una fácil adopción en otros sitios industriales que se mueven hacia la automatización.
El profesor Sung-Hoon Ahn enfatizó el potencial de la tecnología auditiva, afirmando: “A diferencia de las ondas electromagnéticas utilizadas en las tecnologías de comunicación tradicionales, que están obstruidas por las paredes u obstáculos, el sonido puede pasar a través de huecos estrechos y ser escuchado, lo que lo convierte en un medio prometedor para nuevos métodos de interacción”.
El candidato a doctorado Semin Ahn, el autor principal del documento, reflejó el proceso de investigación: “Anteriormente, determinar las posiciones que utilizan sonido requerían múltiples sensores o cálculos complejos. Desarrollar un sensor 3D capaz de localizar con precisión fuentes de sonido con solo un micrófono único giratorio abre nuevas avenidas en tecnología de detección acústica”.
Ahn, un candidato a doctorado en el innovador laboratorio de fabricación y diseño integrado de la Universidad Nacional de Seúl, está investigando el desarrollo de un “filtro de paso de banda acústico” basado en estructuras inteligentes. Esta tecnología tiene como objetivo capturar selectos de frecuencia específicos selectivamente incluso en entornos de alto ruido.
El plan futuro implica mejorar el sistema 3DAR en un sistema auditivo robótico más avanzado, integrarlo con sistemas cognitivos basados en el modelo de lenguaje grande (LLM) para permitir a los robots comprender el significado de sonidos como humanos y aplicar esto a robots humanoides.
Más información: Semin Ahn et al, Human-Robot y Robot-Robot Interaction utilizando un rango acústico tridimensional (3DAR) en frecuencia audible e inaudible, robótica y fabricación integrada por computadora (2025). Doi: 10.1016/j.rcim.2025.102970
Proporcionado por la Universidad Nacional de Seúl
Cita: el micrófono 3D de sensor único permite a los robots localizar a los humanos en entornos ruidosos (2025, 9 de junio) recuperado el 9 de junio de 2025 de https://techxplore.com/news/2025-06-sensor-3d-microphone-enables-robots.html
Este documento está sujeto a derechos de autor. Además de cualquier trato justo con el propósito de estudio o investigación privada, no se puede reproducir ninguna parte sin el permiso por escrito. El contenido se proporciona solo para fines de información.