Home Tecnología El sistema de IA creado para los lugares de trabajo más peligrosos...

El sistema de IA creado para los lugares de trabajo más peligrosos del mundo

46
0

Presentamos la construcción segura, el primer modelo de reconocimiento de violación de seguridad de visión múltiple 3D para sitios de construcción. Consiste en (a) una configuración de múltiples cámaras, (b) un generador de sitios de construcción de interiores sintéticos (SICSG) y (c) un módulo de asociación de visión transversal 3D y un módulo de coincidencia de cumplimiento. Crédito: ARXIV (2025). Doi: 10.48550/arxiv.2504.10880

Todos los días, millones de trabajadores pasan a los sitios de construcción, probablemente algunos de los entornos más peligrosos de la industria moderna. A pesar de los años de protocolos de seguridad, mejoras de equipos y programas de capacitación, la construcción continúa ubicándose entre las principales industrias por lesiones y muertes en el lugar de trabajo en todo el mundo. Durante años, hemos preguntado: ¿podría ayudar la inteligencia artificial? Hasta ahora, los resultados se han mezclado.

Los sitios de construcción son dinámicos, desordenados e impredecibles, llenos de trabajadores, equipos y maquinaria pesada. Este caos presenta un desafío importante para los sistemas tradicionales de visión por computadora, que generalmente están diseñados para entornos limpios, estructurados y sin oclusión. Si bien la IA ha transformado industrias como la conducción autónoma y la fabricación inteligente, su impacto en la seguridad de la construcción se ha retrasado.

En el departamento de ingeniería mecánica de la Universidad Carnegie Mellon, nos propusimos avanzar en las soluciones de visión por computadora que hacen que los sitios de construcción sean más seguros, inteligentes y más eficientes, una de las aplicaciones más desafiantes y poco exploradas de IA en la comunidad más amplia de la visión informática.

Diseñamos un nuevo modelo, Safe-Construct, que se presentará en la conferencia IEEE/CVF sobre Visión por Computadora y Reconocimiento de Patrones (CVPR 2025) Análisis afectivo y de comportamiento en el taller en el Wild, celebrado en Nashville del 11 al 15 de junio. El documento está disponible en el servidor ARXIV Preprint.

El equipo de investigación comenzó con una pregunta simple: ¿qué se necesitaría para enseñarle a una máquina a preocuparse por la seguridad como un supervisor? No en teoría, sino en la práctica. No simplemente contando cascos en las fotos, sino al ver el riesgo como lo haría un humano. O incluso mejor. El proyecto, construcción segura, redefine cómo la IA puede “ver” y responder a los riesgos de seguridad del mundo real en la construcción, no hipotéticamente, sino operacionalmente.

Los modelos anteriores entrenan en datos de origen público o mínimo: Pictor-V2, Pictor-V3 y RoboFlow enmarcando el problema como una tarea de detección de objetos 2D. Estos carecen de comprensión espacial 3D y contexto de objeto de trabajo a nivel de escena. Estos conjuntos de datos son pequeños, y la mayoría de las imágenes tienen resoluciones y perspectivas poco realistas (ver imágenes 1-4 en Pictor-V3, 1-2 en Pictor-V2 y 2-7 en Roboflow). Las configuraciones industriales realistas no presentan trabajadores en la proximidad de la cámara cerrada (<1m). (b) En contraste, la construcción segura es el primer modelo de reconocimiento de violación 3D múltiple que aprovecha la comprensión espacial 3D y el contexto de objeto de trabajo a nivel de escena. Crédito: ARXIV (2025). Doi: 10.48550/arxiv.2504.10880

Repensar la seguridad: de píxeles a posturas

A diferencia de los modelos convencionales que codifican a los trabajadores como meras cajas delimitadoras que a menudo fallan en las condiciones impredecibles de los sitios de construcción activos, la construcción segura adopta un enfoque fundamentalmente nuevo. Utiliza una estimación de pose humana 3D multiperson y visión múltiple para monitorear a los trabajadores en tiempo real, identificando las violaciones de seguridad, el seguimiento de la postura y el análisis del comportamiento en múltiples puntos de vista y en diferentes condiciones.

Hasta donde sabemos, esta es la primera vez que dicho sistema se ha diseñado específicamente para entornos de construcción dinámicos. Puede escalar a cualquier número de trabajadores, adaptarse a todas las industrias y operar en vivo en el sitio. Lo más importante, el modelo redefine el reconocimiento de violación de seguridad de la construcción como una tarea de compromiso de visión múltiple 3D.

Las imágenes sintéticas generadas por SICSG representan variaciones en la iluminación, la perspectiva y los antecedentes, lo que permite a los modelos exhibir el sentido común físico. Crédito: ARXIV (2025). Doi: 10.48550/arxiv.2504.10880

Construido para el mundo real, entrenado en simulación

Durante el entrenamiento del modelo, el equipo aprovechó la generación de datos sintéticos, la transferencia SIM2Real y la aleatorización del dominio, las tecnicas que esencialmente arrojan el modelo AI a cientos de escenarios simulados de qué if, preparándolo para manejar la imprevisibilidad del mundo real. Las pruebas se llevaron a cabo en las instalaciones de fabricación avanzada de CMU en Mill-19, un centro de robótica e innovación industrial.

El resultado: un sistema generalizable que no solo detecta si un trabajador lleva un sombrero duro, comprende cómo los trabajadores se mueven, interactúan y realizan tareas, ofreciendo una comprensión más profunda y consciente de la seguridad. Incluso puede detectar violaciones avanzadas, como si una escalera se está estabilizando adecuadamente mientras otro trabajador sube, una interacción que involucra múltiples trabajadores, herramientas y comprensión contextual.

Más allá de la detección: hacia gemelos digitales y visión egocéntrica

Pero la construcción segura no se detiene en la detección de violación. El equipo ahora está desarrollando un ecosistema gemelo digital completo: una réplica virtual en vivo del sitio de construcción que permite a los gerentes monitorear los indicadores clave de rendimiento (KPI) como la seguridad, la productividad y la calidad.

Resultados cualitativos de reconocimiento de violación de seguridad. Mostramos la re-preparación 2d de la pose del trabajador y el objeto en el plano de la imagen: las filas (a), (b) muestran dos escenarios seguros, mientras que (c), (d) ilustra dos violaciones: (a) el trabajador que usa un sombrero duro, (b) Segundo trabajador que mantiene la escalera de la escalera cuando la primera escalada, (c) solo un trabajador que lleva una ventana grande que debe ser llevada por dos trabajadores que muestran un escenario de violación (el Magent, lo que representa la ventana pequeña), en la materia, la ventana pequeña). (d) Dos trabajadores están parados en la plataforma simultáneamente. Crédito: ARXIV (2025). Doi: 10.48550/arxiv.2504.10880

El equipo también está explorando sistemas de cámara de 360 ​​grados y visión egocéntrica (en primera persona), lo que puede traer un contexto más rico y datos centrados en los trabajadores en el análisis, remodelando dramáticamente cómo las empresas entienden el riesgo, evalúan los flujos de trabajo y diseñan protocolos operativos más seguros. El equipo de investigación colaboró ​​con YKK AP Inc. Japón, un líder de la industria global en la creación de soluciones, asegurando que la construcción segura permanezca basada en las necesidades del mundo real y las limitaciones de la industria, extendiendo su impacto mucho más allá del laboratorio.

La construcción nunca puede estar libre de riesgos. Pero el futuro podría ser mucho más seguro, inteligente, más rápido y más consciente de los humanos, que nunca antes.

Esta historia es parte del diálogo de Science X, donde los investigadores pueden informar los resultados de sus artículos de investigación publicados. Visite esta página para obtener información sobre el diálogo de Science X y cómo participar.

Más información: Aviral Chharia et al, construcción segura: redefinir el reconocimiento de violación de seguridad de la construcción como tarea de compromiso de visión múltiple 3D, ARXIV (2025). Doi: 10.48550/arxiv.2504.10880

Información en el diario: ARXIV

Aviral Chharia es un estudiante graduado en la Universidad Carnegie Mellon. Ha sido galardonado con la beca Atk-Nick G. Vlahakis Graduate Fellowship en CMU, la Comunidad de Graduados de Investigación de Pregrado de Estudiantes (Surge) en IIT Kanpur, India, y la Beca de Investigación Mitacs Globalink en la Universidad de Columbia Británica. Además, recibió dos veces la beca de la lista del decano durante su licenciatura. Sus intereses de investigación incluyen visión por computadora, gráficos por computadora y aprendizaje automático.

Cita: Inside Safe-Construct: El sistema AI creado para los lugares de trabajo más peligrosos del mundo (2025, 22 de mayo) recuperado el 22 de mayo de 2025 de https://techxplore.com/news/2025-05-safe-ai-built-world-dangerous.html

Este documento está sujeto a derechos de autor. Además de cualquier trato justo con el propósito de estudio o investigación privada, no se puede reproducir ninguna parte sin el permiso por escrito. El contenido se proporciona solo para fines de información.