Categorización humana y DNN de (izquierda): una imagen RGB estándar. (Medio): una imagen extraída del contorno. (Derecha): una imagen fragmentada que requiere integración de contorno. La gran mayoría de los más de 1,000 modelos probados fallan catastróficamente en una tarea de categorización en el momento en que los contornos del objeto están fragmentados. Crédito: ARXIV (2025). Doi: 10.48550/arxiv.2504.05253
Un estudio de EPFL revela por qué los humanos se destacan al reconocer objetos de fragmentos mientras que AI lucha, destacando el papel crítico de la integración del contorno en la visión humana.
Todos los días, reconocemos sin esfuerzo a los amigos en una multitud o identificamos formas familiares, incluso si están en parte ocultos. Nuestros cerebros reúnen fragmentos en objetos enteros, llenando los espacios en blanco para dar sentido a un mundo a menudo caótico.
Esta habilidad se llama “integración de contornos” y es algo que incluso los sistemas de IA más inteligentes aún son difíciles de hacer. A pesar de los notables logros de la inteligencia artificial en el reconocimiento de imágenes, AIS aún lucha por generalizar de información visual incompleta o rota.
Cuando los objetos están parcialmente ocultos, borrados o divididos en fragmentos, la mayoría de los modelos de IA vacilan, clasifican erróneamente o se rinden. Este puede ser un problema grave en la vida real, dada nuestra creciente dependencia de la IA para aplicaciones del mundo real, como automóviles autónomos, prótesis y robótica.
El laboratorio EPFL Neuroai, dirigido por Martin Schrimpf, se propuso comparar sistemáticamente cómo las personas y la IA manejan rompecabezas visuales. Ben Lönnqvist, un estudiante graduado de Edne y autor principal del estudio, colaboró con el Laboratorio de Psicofísica de Michael Herzog para desarrollar una serie de pruebas de reconocimiento en las que tanto los humanos como más de 1,000 redes neuronales artificiales tenían que identificar objetos con foros faltantes o fragmentados. Sus resultados muestran que cuando se trata de la integración del contorno, los humanos superan constantemente la IA de última generación y por qué.
La investigación se presentó en la Conferencia Internacional sobre Aprendizaje Autor (ICML 2025) celebrado en Vancouver, del 13 al 19 de julio. Es disponible en el servidor de preimpresión ARXIV.
El equipo estableció una prueba de reconocimiento de objetos basada en laboratorio con 50 voluntarios. Los participantes vieron imágenes de elementos cotidianos, como tazas, sombreros, sartenes, etc., cuyos contornos fueron borrados o divididos sistemáticamente en segmentos. A veces, solo el 35% de los contornos de un objeto permanecían visibles. Paralelamente, el equipo dio la misma tarea a más de 1,000 modelos de IA, incluidos algunos de los sistemas más poderosos disponibles.
El experimento cubrió 20 condiciones diferentes, variando el tipo y la cantidad de información visual. El equipo comparó el rendimiento en estas condiciones, midiendo la precisión y analizando cómo los humanos y las máquinas respondieron a rompecabezas visuales cada vez más difíciles.
Los humanos demostraron ser notablemente robustos, a menudo anotando una precisión del 50% incluso cuando faltaba la mayoría del esquema de un objeto. Los modelos de IA, por el contrario, tendían a colapsar con la adivinación aleatoria en las mismas circunstancias. Solo los modelos entrenados en miles de millones de imágenes se acercaron al rendimiento humano, e incluso entonces, tuvieron que adaptarse específicamente a las imágenes del estudio.
Excavando más profundamente, los investigadores encontraron que los humanos muestran una preferencia natural por reconocer objetos cuando las piezas fragmentadas apuntan en la misma dirección, a la que el equipo conocía como “sesgo de integración”. Los modelos de IA que fueron entrenados para desarrollar un sesgo similar tuvieron un mejor rendimiento cuando se desafió con las distorsiones de la imagen. La capacitación de sistemas AI diseñados específicamente para integrar contornos aumentó su precisión y también los hizo enfocarse más en la forma de un objeto, en lugar de la textura de la superficie.
Estos resultados sugieren que la integración del contorno no es un rasgo cableado, sino que se puede aprender de la experiencia. Para las industrias que dependen de la visión por computadora, como los automóviles autónomos o las imágenes médicas, la construcción de IA que ve al mundo más como nosotros podría significar tecnología más segura y confiable.
El trabajo también muestra que la mejor manera de cerrar la brecha no es jugar con la arquitectura de IA, sino al dar a las máquinas una dieta visual más “humana”, incluidas múltiples imágenes del mundo real donde los objetos a menudo están en parte ocultos.
Más información: Ben Lonnqvist et al, la integración del contorno subyace en la visión de tipo humano, ARXIV (2025). Doi: 10.48550/arxiv.2504.05253
Información en el diario: ARXIV
Proporcionado por Ecole Polytechnique Federal de Lausanne
Cita: ¿Por qué los humanos se destacan por reconocer objetos de fragmentos mientras que AI lucha (2025, 22 de julio) recuperó el 22 de julio de 2025 de https://techxplore.com/news/2025-07-humans-excel-fragments-ai-truggles.html
Este documento está sujeto a derechos de autor. Además de cualquier trato justo con el propósito de estudio o investigación privada, no se puede reproducir ninguna parte sin el permiso por escrito. El contenido se proporciona solo para fines de información.