Pogled na novo Al Generative Art

Al Generative Art je zvrst umetnosti, v večini primerov vizualne, ki temelji na sodelovanju med človekom in avtonomnim sistemom. "Avtonomni sistem" je opredeljen kot Umetna inteligenca programska oprema, algoritem ali model, ki je sposoben izvajati kompleksne operacije brez potrebe po posredovanju programerja.

Iz bizarnih jukstapozicij slik, ki jih je ustvaril Dall-E Mini k NFT na trgu slike, ki jih ustvarijo algoritmi umetne inteligence, vse bolj vstopajo v domišljijo običajnih tokov. Pravzaprav sta dva pomembna projekta na to temo, ki si zaslužita analizo: vmesna pot in DALL-E2.

Seveda je novica prišla tudi na Twitter. To je med drugim komentiral Charles Hoskinson, ki je zapisal:

Al Generative Art: zgodnji poskusi in značilnosti

Ko razumemo, kaj je generativna umetnost, je pomembno poudariti eno od njenih temeljnih načel: naključnost. Kar je temeljna lastnost generativne umetnosti.

Pravzaprav lahko avtonomni sistem, odvisno od vrste programske opreme, obdela rezultate, ki so vedno drugačni in edinstveni vsakič, ko se izvede ukaz za generiranje, ali pa vrne spremenljivo število rezultatov kot odgovor na vnos uporabnika.

Prvi poskusi v generativni umetnosti segajo v šestdeseta leta prejšnjega stoletja z eksperimenti Harold Cohen in njegov AARON program. Cohen je najprej uporabil samostojno programsko opremo za ustvarjanje abstraktnih umetnin, ki so jih navdihnili pop art sitotiski. Cohenova dela so zdaj na ogled v galeriji Tate v Londonu.

Še en atribut generativne umetnosti, ki pa je vedno manj prerogativ, je ponavljanje vzorcev ali abstraktnih elementov, ki jih zagotovi programer in implementira v programsko kodo.

Poleg tega je razvoj vse bolj zapletenih nevronskih mrež, ki delujejo na povezovanju besedila in slike, omogočil razvoj generativnih modelov, ki lahko ustvarijo vse bolj realistične in natančne slike. Najbolj znan primer te kategorije generativne umetnosti je Plošča.

Dall-E je multimodalna nevronska mreža, ki temelji na GPT-3 model globokega učenja iz OpenAI, isto podjetje, ki se je prav tako nedavno razvilo ChatGPT, chatbot, ki je bil predstavljen novembra 2022 in optimiziran z “nadzorovan” in tehnike učenja s krepitvijo.

Če se vrnemo k Dall-E, vidimo, da je ta sistem sposoben generirati slike iz besedilnega opisa, imenovanega "poziv," temelji na naboru podatkov parov besedilo-slika.

Prva različica Dall-E, ki je bila javnosti predstavljena januarja 2021 in je ostala v pristojnosti majhnega števila strokovnjakov na tem področju, je predstavljala pravo revolucijo v smislu tovrstnega generativnega modela, ki je presegla inovacije GPT-a. 3 sama.

Pomembno je tudi dejstvo, da se je natančnost rezultatov, ki jih obdeluje Dall-E, izkazala za odlično možnost za drugo rešitev OpenAI: CLIP (Predhodno usposabljanje kontrastnega jezika in slike).

Nevronska mreža za klasifikacijo in razvrščanje slik, usposobljena na podlagi povezav med besedilom in sliko, kot so napisi v internetu. Zahvaljujoč intervenciji CLIP, ki zmanjša število rezultatov, predlaganih uporabniku na poziv, na 32, je bilo ugotovljeno, da Dall-E v večini primerov vrača zadovoljive slike.

Midjourney: načrtovanje, človeška infrastruktura in umetna inteligenca

Kot je bilo pričakovano, vmesna pot je pomemben projekt, ki je del nastajajočega koncepta Al Generative Art. Natančneje, Midjourney je neodvisen raziskovalni laboratorij, ki raziskuje nove načine razmišljanja in širi domišljijske moči človeške vrste.

Uporaba je preprosta: najprej je treba ustvariti račun na Razpad, platforma, ki gosti različne skupnosti, med katerimi je tudi Midjourney. Znotraj aplikacije so različne klepetalnice, v katerih lahko aktivno ali ne sodelujete v razpravah.

Pomembno je poudariti, da morate za prvo uporabo umetne inteligence iti na “novinci” kanalov, kjer 25 brezplačnih upodobitev so na voljo.

Ena upodobitev ustreza generiranju štirih različnih različic, ustvarjenih iz istega besedilnega vnosa.

Tako se 25 upodobitev nanaša na 25 opravil obdelave, ki jih izvaja bot Midjourney. Posledično ustvarjanje slike zahteva interakcijo z botom Midjourney prek besedilnega sporočila, imenovanega »poziv«, v katerem bodo ključne besede, ki opisujejo sliko, ki jo ima uporabnik v mislih.

Dodate lahko poljubno število podrobnosti, pomembno je, da ključne besede razdelite z vejico. Ko je upodabljanje končano, računalnik vrne štiri različne slike na podlagi opisov, med katerimi lahko izbirate.

Poleg tega lahko, ko program konča upodabljanje, sporočite svoje želje na podlagi slik in, če želite, znova ustvarite še štiri različice.

DALL-E 2: nov sistem AI za umetniška dela

Poleg Midjourneyja je DALL-E 2 tudi nov sistem AI, ki lahko ustvari realistične slike in umetniška dela iz opisa v naravnem jeziku. Ne le to, DALL-E 2 lahko združuje tudi koncepte, atribute in sloge.

Moč novega sistema umetne inteligence je tudi v tem, da lahko slike razširi preko tistega, kar je na izvirnem platnu, in ustvari nove obsežne kompozicije. Poleg tega lahko naredi realistične spremembe obstoječih slik iz napisa v naravnem jeziku ter dodaja in odstranjuje elemente ob upoštevanju senc, odsevov in tekstur.

Zmožnosti DALL-E 2 vključujejo tudi snemanje slike in ustvarjanje več njenih različic po navdihu izvirnika. DALL-E 2 se je naučil razmerja med slikami in besedilom, ki se uporablja za njihov opis.

Uporablja postopek, imenovan "difuzija," ki se začne z vzorcem naključnih pik in postopoma spreminja ta vzorec proti sliki, ko prepozna posebne vidike te slike.

Potem ko je OpenAI januarja 2021 predstavil DALL-E, zdaj najnovejši sistem, DALL-E 2, ustvarja bolj realistične in natančne slike s štirikratno ločljivostjo.

DALL-E 2 se je začel kot raziskovalni projekt in je zdaj na voljo kot beta različica. Varnostne ublažitve, ki jih je sistem razvil in še izboljšuje, vključujejo: omejevanje zmožnosti sistema za ustvarjanje nasilnih, sovražnih ali odraslih slik ter postopno uvajanje na podlagi učenja.

Vir: https://en.cryptonomist.ch/2023/02/02/ai-generative-art/