Det värsta med bildgeneratorer är att de behöver så mycket data att det finns ingen hos företagen...

Det värsta med bildgeneratorer är att de behöver så mycket data att det finns ingen hos företagen som bygger dem som kan ha koll på var datan kommer från och vad som faktiskt finns porträtterat. Ingen kan egentligen ta ansvar.

Därför är jag särskilt besvärad av genererade bilder med barn, eftersom det sedan tidigare framkommit att stora dataset kan innehålla många bilder från övergrepp. Det är så stora mängder bilder så att det skulle ta tusentals år att kolla igenom dem - för mig är det egentligen självklart att det innehåller våldsamma bilder av allehanda slag.

Så när det genereras en bild (eller film som det var i fallet med SVT) där barn figurerar så undrar jag alltid: varför dyker just det barnansiktet upp? Vems barn är det som kanske råkade ut för beräkningsmodellen den här gången…. Det är sån’t som får mig att rysa mitt i allt annat som mjukvaran orsakar. 😬

Tusentals år, säger Per? Tja, ett känt dataset som heter LAION-5B består av 5,8 miljarder foton. Om du hade som heltidsjobb, 5 dagar i veckan och 8 timmar om dagen, att titta på varje bild i detta dataset under endast 1 sekund – så skulle det ta dig cirka 775 år.