Home Tecnología AI y los humanos ven los objetos de manera diferente: significado versus...

AI y los humanos ven los objetos de manera diferente: significado versus características visuales

7
0

Incrustaciones representativas inferidas del comportamiento humano y DNN. Crédito: Nature Machine Intelligence (2025). Doi: 10.1038/s42256-025-01041-7

Mientras que los humanos se concentran en el significado de los objetos, la inteligencia artificial se centra en las características visuales.

“Estas dimensiones representan diversas propiedades de los objetos, que van desde aspectos puramente visuales, como ‘redondo’ o ‘blanco’, hasta propiedades más semánticas, como ‘relacionado con los animales’ o ‘relacionado con el fuego’, con muchas dimensiones que contienen elementos visuales y semánticos”, explica el Florian Mahner del Instituto Max Planck para las ciencias cognitivas y cerebrales humanas.

“Nuestros resultados revelaron una diferencia importante: si bien los humanos se centran principalmente en las dimensiones relacionadas con el significado, qué es un objeto y lo que sabemos al respecto, los modelos de AI dependen más de las dimensiones que capturan las propiedades visuales, como la forma o el color del objeto. Llamamos a este fenómeno ‘sesgo visual’ en IA.

“Incluso cuando la IA parece reconocer los objetos al igual que los humanos, a menudo usa estrategias fundamentalmente diferentes. Esta diferencia es importante porque significa que los sistemas de IA, a pesar de comportarse de manera similar a los humanos, pueden pensar y tomar decisiones de maneras completamente diferentes, lo que afecta cuánto podemos confiar en ellos”.

Juicios por imágenes

Para el comportamiento humano, los científicos utilizaron alrededor de 5 millones de juicios de Odd-Out disponibles públicamente en más de 1,854 imágenes de objetos diferentes. Por ejemplo, a un participante se le mostraría una imagen de una guitarra, un elefante y una silla y se le preguntaría qué objeto no coincide. Luego, los científicos trataron múltiples redes neuronales profundas que pueden reconocer imágenes análogas a los participantes humanos y recopilaron juicios de similitud para las imágenes de los mismos objetos utilizados para los humanos.

Luego, aplicaron el mismo algoritmo para identificar las características clave de estas imágenes, las “dimensiones” de los científicos, que subyacen a las decisiones extrañas. Al tratar la red neuronal análoga a los humanos, esto aseguró la comparabilidad directa entre los dos.

“Cuando observamos por primera vez las dimensiones que descubrimos en las redes neuronales profundas, pensamos que en realidad se veían muy similares a las que se encuentran en los humanos”, explica Martin Hebart, último autor del artículo. “Pero cuando comenzamos a mirar más de cerca y comparamos con los humanos, notamos diferencias importantes”.

Además del sesgo visual identificado por los científicos, utilizaron técnicas de interpretabilidad comunes en el análisis de redes neuronales para juzgar si las dimensiones que encontraron realmente tenían sentido. Por ejemplo, una dimensión podría presentar muchos animales y puede llamarse “relacionado con animales”.

Para ver si la dimensión realmente respondió a los animales, los científicos realizaron múltiples pruebas: observaron qué partes de las imágenes fueron utilizadas por la red neuronal, generaron nuevas imágenes que mejor coincidieron con las dimensiones individuales, e incluso manipularon las imágenes para eliminar ciertas dimensiones. “Todas estas pruebas estrictas indicaron dimensiones muy interpretables”, agrega Mahner.

“Pero cuando comparamos directamente las dimensiones coincidentes entre los humanos y las redes neuronales profundas, descubrimos que la red solo se aproximaba realmente estas dimensiones. Para una dimensión relacionada con los animales, no se incluyeron muchas imágenes de animales, y de la misma manera, se incluyeron muchas imágenes que no eran animales en absoluto. Esto es algo que habríamos perdido con las técnicas estándar”.

Los científicos esperan que la investigación futura utilice enfoques similares que comparen directamente a los humanos con la IA para comprender mejor cómo la IA tiene sentido del mundo. “Nuestra investigación proporciona un método claro e interpretable para estudiar estas diferencias, lo que nos ayuda a comprender mejor cómo la IA procesa la información en comparación con los humanos”, dice Hebart. “Este conocimiento no solo puede ayudarnos a mejorar la tecnología de IA, sino que también proporciona información valiosa sobre la cognición humana”.

Más información: Florian P. Mahner et al, dimensiones subyacentes a la alineación representativa de redes neuronales profundas con humanos, la inteligencia de la máquina de la naturaleza (2025). Doi: 10.1038/s42256-025-01041-7

Proporcionado por Max Planck Society

Cita: IA y humanos Vea los objetos de manera diferente: Significado versus características visuales (2025, 24 de junio) Recuperado el 24 de junio de 2025 de https://techxplore.com/news/2025-06-ai-humans-diFferention-visual-features.html

Este documento está sujeto a derechos de autor. Además de cualquier trato justo con el propósito de estudio o investigación privada, no se puede reproducir ninguna parte sin el permiso por escrito. El contenido se proporciona solo para fines de información.

Fuente de noticias