Tehno

Kako zaštiti fotografije i podatke od generirane umjetne inteligencije

09. Veljača 2023.

Piše:

U zadnje se vrijeme na internetu mnogo govori o tekstovima i fotografijama koje su generirane umjetnom inteligencijom, što je izazvalo mnogo rasprava, ali i straha u kreativnoj zajednici. Kreativci su se pobunili jer generatori umjetne inteligencije koriste umjetnička djela, tekstove te sve ostale vrste intelektualnog vlasništva za stvaranje ‘novih‘ verzija, naravno bez pristanka ljudskih kreatora.

Iako je zabavno oponašati djela davno nestalih umjetnika poput Van Gogha ili Fride Kahlo s AI generatorom, isto baš i ne vrijedi za živuće umjetnike. Dopuštanje gotovo svakome da stvori sliku ‘u stilu‘ umjetnika, što nude mnogi generatori, može uzrokovati da njihovo tržište bude preplavljeno kopijama što zasigurno vodi do problema s autentičnosti, a i potencijalnog gubitka prihoda za umjetnike i kreativce.

Kao odgovor na to, ljudi traže način da zaštite svoje slike i radove od AI umjetničkih generatora.

Kako AI generatori dolaze do podataka

AI umjetnički generatori prolaze kroz razdoblje ‘treninga‘ kako bi naučili proizvesti sliku kada dobiju tekstualni upit. Kao dio procesa učenja, potrebno je proučiti stotine milijuna parova slika-tekst kako bi se na kraju stvorila točna slika objekata, boja i scena iz stvarnog svijeta - uz umjetničke tehnike i stil. Kako to već biva, AI modeli moraju učiti iz ljudske kreativnosti.

Na primjer, Midjourney i Stability Diffusion dva su AI ‘umjetnička‘ generatora obučena na skupu podataka LAION-5B otvorenog koda koji sadrži milijarde slika s cijelog interneta. Koristeći alate za indeksiranje weba za ‘scraping‘ (struganje) web stranica za podatke, ovi skupovi podataka stvaraju popise URL-ova slika, plus njihov naslov, u nečemu što bi moglo nalikovati masivnoj Excel proračunskoj tablici.

Isključite skupove podataka za obuku AI

Grupa umjetnika koja se okupila pod nadimkom ‘Spawning‘ pokrenula je web stranicu naziva ‘Have I Been Trained?‘ pomoću koje se može provjeriti nalaze li se i vaša djela i slike u skupu podataka LAION-5B, a postoji i funkcija isključivanja iz te baze. Prema ugovoru, Spawning prosljeđuje popise korisnika za isključenje iz baze LAION-5B, ali ne postoje ugovori s drugim skupovima podataka.

Budući da mnoge AI tvrtke ne otkrivaju detalje o tome kako su izgrađeni njihovi AI modeli, ponekad nije jasno koji skup podataka koriste. DALL-E je jedan popularni umjetnički generator umjetne inteligencije koji recimo ne dijeli ove informacije. Alternativno, ako koristite primjerice, DeviantART za dijeljenje svojih umjetničkih djela, vaše su slike prema zadanim postavkama zaštićene od korištenja za skupove podataka za obuku umjetne inteligencije. DeviantART označava slike s oznakom ‘noai‘, što znači da će, ako se utvrdi da je AI model koristio tu sliku za obuku, prekršiti DeviantARTove uvjete pružanja usluge.

Naravno, ove se mjere isključivanja ne provode, tako da ih treće strane mogu zanemariti ako žele. Iako ovo nije najučinkovitije rješenje, na dobrom je putu da se uvede više pravila i propisa kako bi se zaštitili umjetnici.

U idealnom svijetu, ljudima bi bila dana mogućnost uključivanja, umjesto da se moraju isključivati..

Zaštitite svoj rad autorskim pravima

Početkom 2023. poznata strip crtačica, Sarah Andersen, bila je dio grupe umjetnika koji su pokrenuli tužbu protiv AI tvrtki Stability AI i Midjourney, kao i web stranice za dijeljenje umjetnina DeviantART, zbog scrapinga njihove umjetnosti bez pristanka. Još jedan primjer je web stranica Getty Images, koja je podnijela tužbu protiv Stability AI-a zbog scrapinga njegovih slika bez licence.

Način na koji je otkrio da se koriste njegove slike zaštićene autorskim pravima bio je kada su se slike generirane umjetnom inteligencijom počele pojavljivati s vodenim žigom Getty Imagesa - što je prilično očigledan propust AI-ja. Dok će se zakonitost utvrditi u dogledno vrijeme, autorska prava jedna su od rijetkih stvari kojom se umjetnici mogu boriti za prava svojih djela. To je praksa o kojoj ionako vrijedi naučiti kako biste mogli zaštititi svoj rad od krađe, bez obzira je li uključena AI ili ne.

Blokirajte ‘crawlere‘ s Robots.txt

Crawleri služe za indeksiranje i korisni su i pomažu tražilicama poput Googlea pronaći i indeksirati najrelevantnije informacije za prikaz na stranici rezultata pretraživanja. Drugi se koriste za traženje slika s web stranica za uključivanje u skupove podataka za obuku AI-ja.

Tu na scenu stupa Robots.txt. Robots.txt je tekstualna datoteka koja se može postaviti u pozadinski kod web-mjesta kako bi rekla web-puzačima (crawlerima) što mogu, a što ne mogu skenirati i indeksirati. Robots.txt se može upotrijebiti ako ne želite da AI pokrade i vaše slike.

Što očekivati u budućnosti

S jedne strane, sudski postupci su u procesu utvrđivanja što je legalno i kako autorska prava funkcioniraju s generiranjem slika AI-jem. Ovakvi postupci, ali i javne rasprave postavit će zakonske standarde, a možda i propise, koje AI tvrtke moraju slijediti. S druge strane, programeri razmišljaju kako riješiti problem pomoću nove tehnologije. U jednoj obećavajućoj studiji, istraživanje pokazuje da možete upotrijebiti umjetnu inteligenciju za borbu protiv same sebe tako što ćete sliku učiniti ‘nevidljivom‘ skupovima podataka koji se koriste za obuku umjetne inteligencije.

#MIDJOURNEY #UMJETNA INTELIGENCIJA #STABILITY DIFFUSION #DALL-E #CHATGPT #GETTY IMAGES #KREATIVNA INDUSTRIJA