Notebookcheck Logo

Un fotógrafo pone de relieve el campo minado de la IA generativa de derechos de autor y crea copias convincentes de "las fotos más icónicas de todos los tiempos"

Parece que, incluso sin indicaciones directas, los generadores de imágenes por IA son capaces de recrear fotos clásicas, como la de Almuerzo en lo alto de un rascacielos. (Fuente de la imagen: Dominio público / DALL-E vía PetaPixel)
Parece que, incluso sin indicaciones directas, los generadores de imágenes por IA son capaces de recrear fotos clásicas, como la de Almuerzo en lo alto de un rascacielos. (Fuente de la imagen: Dominio público / DALL-E vía PetaPixel)
Un fotógrafo se propuso recrear algunas de las imágenes más reconocibles de todos los tiempos utilizando Midjourney y DALL-E. Para sorpresa de absolutamente nadie, los sistemas de IA fueron capaces de recrear con sorprendente precisión cada una de las imágenes, entre las que se encontraban la Niña Afgana y el triunfo de Muhammad Ali sobre Sonny Liston.

Desde que los sistemas de IA generativa, como Midjourney y DALL-E estallaron en popularidad hacia principios o mediados de 2022, no ha habido no han faltado artistas en armas contra los sistemas por violación de los derechos de autor. Es natural que haya cierta contestación, ya que los sistemas de IA se entrenan en gran medida con imágenes protegidas por derechos de autor para las que no se obtuvo ninguna licencia.

Un fotógrafo, Matt Growcoot, de PetaPixel, se propuso comprobar lo fácil que sería conseguir que dos potentes IA de generación de imágenes - Midjourney y DALL-E - recrearan algunas de las imágenes más icónicas y reconocibles de la historia. Resultó que no era especialmente difícil.

La lista de fotografías que se pidió a las IA que recrearan era la siguiente: Día V-J en Times Square de Alfred Eisenstaedt, la foto de la portada de Abbey Road de los Beatles, Madre emigrante de Dorothea Lange, Almuerzo en lo alto de un rascacielos (autor desconocido), Los Tetons y el río Snake de Ansel Adams, La chica afgana de Steve McCurry, Izar la bandera en Iwo Jima de Joe Rosenthal, Detrás de la Gare Saint-Lazare de Henri Cartier-Bresson, La victoria de Muhammad Ali sobre Sonny Liston de John Rooney, Earthrise de William Anders, y la foto de Don McCullin de un marine estadounidense en estado de shock durante la guerra de Vietnam.

Aunque los sistemas de IA no produjeron copias exactas de las imágenes en cuestión, los resultados (que puede ver en el post de Growcoot en PetaPixel o desplazándose hasta el post incrustado de X, antes Twitter) son inquietantemente similares en muchos casos. La imagen que resultó más difícil de recrear tanto para Midjourney como para DALL-E fue Detrás de la Gare Saint-Lazare de Cartier-Bresson, mientras que la estética y el tono de imágenes como la Niña afgana y la victoria de Ali sobre Liston eran sorprendentemente similares al original, aunque no fueran réplicas exactas.

El paisaje de Adams era probablemente la más parecida en términos de recreación exacta, mientras que Madre emigrante, Abbey Road, Día V-J en Times Square y Almuerzo en lo alto de un rascacielos eran también muy similares a sus homólogas hechas por el hombre.

Estas representaciones exactas de las fotos originales fueron a pesar de las indicaciones bastante detalladas, pero no específicas, como "Haga una imagen fotorrealista en blanco y negro de 1945 de un marinero besando a una chica vestida de blanco mientras lo celebran en Times Square, Nueva York", y "Haga una dramática foto en blanco y negro tomada en 1942 del Parque Nacional Grand Teton en Wyoming. El río Snake está en primer plano con las montañas al fondo"

También es interesante ver que, aunque las recreaciones de las imágenes eran todas bastante representativas de las obras originales, cada algoritmo de IA generativa sigue teniendo su propio aspecto. Las imágenes de Midjourney seguían siendo sistemáticamente más realistas, mientras que las de DALL-E tenían todas el tipo de neblina suave que todos esperamos de la IA generativa, como si las imágenes se hubieran tomado con algo parecido a un filtro difusor (que se puede encontrar en Amazon por tan sólo 10,49 dólares) o una lente con vaselina untada en la parte frontal.

El éxito de este experimento no sólo pone de relieve la importancia de esfuerzos como el de las credenciales de contenido de Leica, sino que, una vez más, plantea serios interrogantes sobre el futuro papel de la fotografía en los esfuerzos documentales y periodísticos.

Si está interesado en tomar el camino más largo para crear imágenes artísticas, eche un vistazo a la Fujifilm X-S20 en Amazon (actualmente 1.151 $)

Please share our article, every link counts!
> Análisis y pruebas de ordenadores portátiles y móviles teléfonos > Noticias > Archivo de noticias > Archivo de noticias 2024 03 > Un fotógrafo pone de relieve el campo minado de la IA generativa de derechos de autor y crea copias convincentes de "las fotos más icónicas de todos los tiempos"
Julian van der Merwe, 2024-03- 8 (Update: 2024-03- 8)