Ustanovitelj Midjourney David Holz o vplivu umetne inteligence na umetnost, domišljijo in kreativno ekonomijo

vmesna pot je eden od vodilnih gonil nastajajoče tehnologije uporabe umetne inteligence (AI) za ustvarjanje vizualnih podob iz besedilnih pozivov. Startup s sedežem v San Franciscu je pred kratkim prišel v novice kot motor umetniškega dela, ki je prejel nagrado na poštenem tekmovanju v zvezni državi Kolorado, in to verjetno ne bo zadnje zapleteno vprašanje, s katerim se bo umetnost umetne inteligence soočila v prihodnjih letih.

Midjourney se od drugih v prostoru razlikuje s poudarjanjem slikarske estetike v podobah, ki jih ustvarja. Platforma ne poskuša ustvariti fotorealističnih slik, ki bi jih lahko zamenjali s fotografijami, izvršni direktor David Holz pa pravi, da je osebno zelo nelagoden zaradi neverjetne kakovosti globokih ponaredkov in drugega dela, ki preveč simulira resničnost. Namesto tega Holz pravi, da je Midjourney zasnovan tako, da sprosti ustvarjalnost navadnih ljudi, tako da jim ponudi orodja za ustvarjanje čudovitih slik samo z opisom.

Toda kljub humanistični, potrošniško usmerjeni usmeritvi podjetja so neizogibna vprašanja o posledicah za komercialno umetnost in profesionalne umetnike. Holza sem intervjuval za širši del o morebitnih motnjah, ki jih bo umetnost umetne inteligence verjetno povzročila pri produkciji slik za zabavo, videoigre in založništvo. Tukaj je daljši odlomek iz našega pogovora, kjer Holz zagotavlja več globine in konteksta, ko obravnava ta vprašanja in razlaga svojo vizijo podjetja, industrije in tehnologije. Intervju je bil prirejen zaradi dolžine in jasnosti.

Rob Salkowitz, sodelavec Forbesa: Kakšna je vaša vloga in naziv?

David Holz, Midjourney. Sem ustanovitelj in izvršni direktor. Običajno mi je pač ljubše, da me imenujejo ustanovitelj, ker CEO zveni zelo poslovno, mi pa nismo zelo poslovni. Smo laboratorij za uporabne raziskave, ki izdeluje izdelke.

Kaj je misija Midjourneyja?

Radi rečemo, da poskušamo razširiti domišljijsko moč človeške vrste. Cilj je narediti ljudi bolj domiselne, ne izdelovati domiselnih strojev, kar se mi zdi pomembna razlika.

Ali lahko na kratko opišete zgodovino podjetja do danes?

Pred približno letom in pol smo začeli delati na domišljijskem delu našega podjetja. Bilo je nekaj prebojev na področju difuzijskih modelov, ljudje so razumeli posnetke, openAI, take stvari. Skoraj vsi vpleteni v to so iz San Francisca in vsi smo se zavedali, da bo to postalo resno, da se razlikuje od mnogih drugih stvari.

Kaj Midjourney vidi kot korist te tehnologije besedila v sliko za podjetja in družbo?

Vsekakor me bolj skrbi družba kot posel. Smo potrošniški izdelek, vendar je trenutno morda 30–50 % naših uporabnikov profesionalcev. Večina jih ni. Umetniki na platformi nam pravijo, da jim omogoča, da so na začetku bolj ustvarjalni in raziskovalni ter da v kratkem času pripravijo veliko idej.

Prav zdaj naši profesionalni uporabniki uporabljajo platformo za konceptiranje. Najtežji del [komercialnega umetniškega projekta] je pogosto na začetku, ko deležnik ne ve, kaj hoče, in mora videti nekaj idej, na katere se mora odzvati. Midjourney lahko pomaga ljudem, da se veliko hitreje zbližajo z idejo, ki jo želijo, saj je ponavljanje teh konceptov zelo naporno.

Druga prednost za umetnike je, da ljudem daje zaupanje na področjih, v katera niso prepričani. Večina, če ne vsi umetniki, menijo, da v nekem delu umetnosti ne morejo dobro delati. Lahko so barve, kompozicija, ozadja. Imamo slavnega oblikovalca likov, ki uporablja naš izdelek, in ljudje ga sprašujejo, zakaj bi uporabil AI, ko si že tako dober. In rekel je: »No, dober sem le v liku. To mi pomaga pri ostalem, svetu, ozadju, barvnih shemah.”

Približno koliko ljudi uporablja izdelek?

Uporabljajo ga milijoni. Naš Discord je več kot dva milijona. To je doslej največji aktivni strežnik Discord.

Ali licenca Midjourney dovoljuje komercialno uporabo slik, ki jih ustvari platforma?

ja Če pa delate za podjetje, ki ima letne prihodke več kot milijon dolarjev, vas prosimo, da kupite licenco za podjetje.

Kako je bil zgrajen nabor podatkov?

To je samo velika praska interneta. Uporabljamo odprte nabore podatkov, ki so objavljeni, in jih usposabljamo. In rekel bi, da je to nekaj, kar počne 100 % ljudi. Nismo bili izbirčni. Znanost se resnično hitro razvija v smislu, koliko podatkov resnično potrebujete, v primerjavi s kakovostjo modela. Trajalo bo nekaj let, da stvari zares ugotovimo, in do takrat boste morda imeli modele, ki jih ne trenirate skoraj nič. Nihče ne ve, kaj lahko stori.

Ali ste zaprosili za soglasje živečih umetnikov ali delate še vedno pod avtorskimi pravicami?

Ne. Pravzaprav ni načina, da bi dobili sto milijonov slik in vedeli, od kod prihajajo. Bilo bi kul, če bi slike imele vdelane metapodatke o lastniku avtorskih pravic ali kaj podobnega. Ampak to ni stvar; ni registra. Ni načina, da bi poiskali sliko na internetu in jo nato samodejno izsledili do lastnika ter nato kakor koli storili, da bi jo potrdili.

Ali lahko umetniki zavrnejo vključitev v vaš model podatkovnega usposabljanja?

To gledamo. Sedaj je izziv ugotoviti, kakšna so pravila in kako ugotoviti, ali je oseba res umetnik določenega dela ali se nanj le pripiše svoje ime. Nismo naleteli na nikogar, ki bi želel, da se njegovo ime odstrani iz nabora podatkov.

Ali lahko umetniki zavrnejo imenovanje v pozivih?

Ne zdaj. To gledamo. Spet bi morali najti način za preverjanje pristnosti teh zahtev, kar se lahko zaplete.

Kaj pravite komercialnim umetnikom, ki jih skrbi, da jim bo to uničilo sredstva za preživetje? Zakaj bi umetniški vodja na določeni točki najel ilustratorja za ustvarjanje dela, kot je konceptualna umetnost, produkcijsko oblikovanje, ozadja – take stvari – ko lahko samo vnese pozive in dobi uporabne rezultate veliko hitreje in po veliko nižji ceni?

Še vedno je veliko dela. Ne gre le za »naredi mi ozadje«. Morda je desetkrat manj dela, vendar je veliko več dela, kot ga bo opravil menedžer.

Mislim, da bi to lahko šlo na dva načina. Eden od načinov je, da poskušamo zagotoviti enako raven vsebine, kot jo ljudje uživajo, po nižji ceni, kajne? In drugi način, da se tega lotimo, je izdelava izjemno boljše vsebine po cenah, ki smo jih že pripravljeni porabiti. Ugotavljam, da večina ljudi, če že zapravlja denar in imate možnost izbire med izjemno boljšo vsebino ali cenejšo vsebino, dejansko izbere izjemno boljšo vsebino. Trg je že vzpostavil ceno, ki so jo ljudje pripravljeni plačati.

Mislim, da bodo nekateri poskušali izločiti umetnike. Poskušali bodo narediti nekaj podobnega po nižji ceni in mislim, da jim bo na trgu spodletelo. Mislim, da bo trg šel v smeri višje kakovosti, več kreativnosti in veliko bolj prefinjene, raznolike in globoke vsebine. In ljudje, ki so dejansko sposobni uporabljati, kot so umetniki, in uporabljajo orodja za to, so tisti, ki bodo zmagali.

Te tehnologije dejansko ustvarjajo veliko globlje spoštovanje in pismenost v vizualnem mediju. Morda boste dejansko imeli povpraševanje, presegli zmožnost produkcije na tej ravni in potem boste morda dejansko zvišali plače umetnikom. Lahko bi bilo čudno, toda to se bo zgodilo. Hitrost tega povečevanja povpraševanja po kakovosti in raznolikosti bo vodila do nekaj čudovitih in nepričakovanih projektov.

Generacija študentov je diplomirala na umetniških šolah, mnogi med njimi močno zadolženi, računajoč na razmeroma dobro plačana dela v zabavni produkciji, produkciji videoiger, komercialni umetnosti itd. Kako pojav platform AI za besedilo v sliko vpliva na njihovo prihodnost?

Mislim, da bodo nekateri poskušali zmanjšati stroške, nekateri pa bodo poskušali povečati ambicije. Mislim, da bodo ljudje, ki širijo ambicije, še vedno plačevali iste plače, ljudje, ki poskušajo znižati stroške, pa mislim, da jim ne bo uspelo.

AI se običajno uporablja v velikem obsegu za stvari, kot so klicni centri ali preverjanje prtljage na letališčih in nekatera dela, ki jih ljudje v resnici ne želijo opravljati. Vrednost pa je v tem, da ljudem omogoča, da opravljajo bolj nagrajujoča in zanimivejša dela. Toda umetniška dela so koristna in zanimiva. Ljudje delajo celo življenje in razvijajo svoje sposobnosti, da dobijo tovrstna dela. Zakaj bi to tehnologijo na tej ravni gospodarstva izpostavili kot nekakšen poslovni fokus in prednostno nalogo za stvari, ki jih počnete?

Osebno nisem. Moje stvari niso narejene za profesionalne umetnike. Če ga radi uporabljajo, potem je to super. Moje stvari so ustvarjene za podobne ljudi, ki, recimo, v Hongkongu je ena ženska, ki je prišla k meni in rekla: »Edina stvar v Hongkongu, za katero tvoji starši nikoli ne želijo, da bi bil, je umetnik, jaz pa zdaj sem bankir. Živim dobro bančno življenje. Toda z Midjourneyjem zdaj dejansko začenjam okusiti to izkušnjo, da sem oseba, kakršna sem si dejansko želel biti.« Ali tip na postajališču za tovornjake, ki izdeluje svoje bejzbolske karte z divjimi podobami, samo za zabavo. Narejen je za te ljudi, ker, kot večina ljudi, nikoli ne morejo početi teh stvari.

Pomembno je poudariti, da ne gre za umetnost. Tu gre za domišljijo. Domišljija se včasih uporablja za umetnost, vendar pogosto ni. Večina slik, ustvarjenih na Midjourneyju, se ne uporablja profesionalno. Sploh se ne delijo. Samo uporabljajo se za te druge namene, za te zelo človeške potrebe.

Kljub temu so rezultat vašega izdelka podobe, ki imajo poleg vseh teh drugih lastnosti komercialno vrednost v profesionalnem kontekstu. In to je zelo moteče za to gospodarstvo.

Mislim, da je tako, kot da izdelujemo čoln in lahko nekdo dirka s čolnom, vendar to ne pomeni, da je čoln namenjen dirkanju. Če uporabljate čoln za dirkanje, potem morda, ja, seveda. V tistem trenutku je. Toda človeška plat je res pomembna in mislim, da nismo ... Slike želimo videti lepe. Ne vidimo, da poskušamo ustvarjati umetnost kot del naše stvari. Želimo si, da bi bil svet bolj domiseln. Raje delamo lepe kot grde stvari.

Ali menite, da ima kateri koli državni organ pristojnost ali pooblastilo za urejanje te tehnologije? In če je tako, ali mislite, da bi morali?

Nevem. Regulacija je zanimiva. Morate uravnotežiti svobodo, da nekaj naredite, s svobodo, da ste zaščiteni. Sama tehnologija ni problem. Je kot voda. Voda je lahko nevarna, v njej se lahko utopiš. Vendar je tudi bistveno. Ne želimo prepovedati vode samo zato, da bi se izognili nevarnim delom.

No, želimo biti prepričani, da je naša voda čista.

Da, to je res.

Vir: https://www.forbes.com/sites/robsalkowitz/2022/09/16/midjourney-founder-david-holz-on-the-impact-of-ai-on-art-imagination-and-the- kreativno-ekonomija/