Home Tecnología El investigador explora los medios visuales a través de la lente de...

El investigador explora los medios visuales a través de la lente de la visión artificial

61
0

Crédito: dominio público Unsplash/CC0

Grandes colecciones visuales, como pinturas, fotografías, dibujos y otras formas de medios visuales, ofrecen información valiosa sobre eventos históricos, vida social y expresión artística. Estas colecciones son clave para comprender cómo las sociedades producen y usan imágenes para dar forma al significado cultural con el tiempo. Sin embargo, siguen siendo difíciles de estudiar debido a su gran tamaño, que a menudo consisten en cientos de miles de elementos, y su complejidad intrínseca, incluidas diversas características visuales, contenidos, contextos y estructuras de metadatos.

En su tesis doctoral, el estudiante de Tallinn University School of Digital Technologies Tillmann Ohm propone una nueva forma de explorar grandes colecciones visuales: a través de la lente de la visión artificial, centrándose no en lo que es una imagen sino en lo que se parece. En lugar de clasificar las imágenes en categorías fijas, el enfoque las organiza en mapas basados ​​en la similitud visual según lo percibido por los algoritmos.

Esto da como resultado espacios de similitud, generados a partir de representaciones matemáticas de imágenes, donde la distancia entre dos puntos refleja cuán similares aparecen las imágenes. Comprender cómo la similitud visual se modela, percibe e interpreta tanto por humanos como por máquinas forma una pregunta de investigación central de la disertación.

Una contribución central de la tesis es el navegador de espacio de recopilación, una interfaz basada en el navegador que permite a los investigadores y curadores explorar los datos de recopilación visual. Los mapas de similitud bidimensionales permiten una investigación interpretativa abierta al revelar patrones, grupos y relaciones visuales que generalmente son difíciles de detectar utilizando metadatos tradicionales o métodos basados ​​en palabras clave.

La interfaz admite la navegación interactiva, el filtrado y la comparación de diferentes modelos y métodos, lo que la hace adaptable a una amplia gama de preguntas de investigación y tipos de recolección. Al facilitar la exploración visual a escala, une el análisis computacional con experiencia humana en interpretación cultural.

El navegador espacial de recolección se ha aplicado a una variedad de colecciones de patrimonio cultural e integrado en flujos de trabajo de investigación interdisciplinarios. Un estudio de caso clave analizó más de 200,000 cuadros de los noticieros soviéticos, utilizando la herramienta para descubrir patrones visuales a largo plazo en la película de propaganda.

Los grupos de imágenes similares revelaron motivos recurrentes, como escenas de liderazgo escenificadas frente al mausoleo de Lenin, mientras que otros cambiaron el tono con el tiempo, como escenas de negociación formales en largas tablas, reflejando estrategias de propaganda cambiantes. Estas narraciones visuales en evolución y persistentes son difíciles de detectar a través de la visualización manual y se hicieron inmediatamente aparentes a través de la exploración basada en la similitud.

La investigación de Ohm contribuye al creciente campo del análisis de datos culturales. Permite que los museos, los académicos y el público obtengan nuevas ideas sobre la cultura visual desafiando la autoridad institucional y algorítmica, al tiempo que fomentan la colaboración interdisciplinaria y profundizando nuestra comprensión de las narrativas culturales a través de herramientas computacionales innovadoras.

OHM defendió su tesis doctoral “diseñando procesos y herramientas para investigar espacios de similitud de colecciones visuales” el 11 de junio. El supervisor de tesis fue Maximilian Günther Schich, profesor de la Universidad de Tallin. Los opositores fueron Lauren Tilton, profesora de la Universidad de Richmond e Iyad Rahwan, profesora del Instituto Max Planck para el Desarrollo Humano.

Proporcionado por el Consejo de Investigación de Estonia

Cita: el investigador explora los medios visuales a través de la lente de la visión artificial (2025, 13 de junio) Recuperado el 13 de junio de 2025 de https://techxplore.com/news/2025-06-explores-visual-media-lens-machine.html

Este documento está sujeto a derechos de autor. Además de cualquier trato justo con el propósito de estudio o investigación privada, no se puede reproducir ninguna parte sin el permiso por escrito. El contenido se proporciona solo para fines de información.