Google Lumiere generator besedila v video poganja AI

Google (NASDAQ: GOOGL) je napovedal nov model umetne inteligence (AI), zasnovan za ustvarjanje realističnih videoposnetkov s funkcijami urejanja v realnem času.

Googlovi raziskovalci, imenovano »Lumiere«, opisujejo novo ponudbo kot model difuzije v času in prostoru, ki je sposoben spremeniti besedilne in slikovne vnose v videe. Lumiere dokazuje strokovnost pri sintetiziranju videoposnetkov v ponudbi, ki jo strokovnjaki iz industrije opisujejo kot »najsodobnejšo«.

Videoposnetke, ustvarjene z umetno inteligenco, so kritizirali zaradi pomanjkanja realizma, podatkovnih omejitev, pristranskosti in natančnega nadzora, kar vzbuja dvome o prihodnosti ponudbe.

"Predstavljamo Lumiere - model difuzije besedila v video, zasnovan za sintetiziranje videoposnetkov, ki prikazujejo realistično, raznoliko in koherentno gibanje - ključni izziv pri sintezi videa," je pisalo v članku.

Vendar poskuša Google rešiti izziv z uvedbo prostorsko-časovne arhitekture U-Net za ustvarjanje časovnega trajanja videa. Prejšnji modeli za generiranje videa ustvarijo ključne sličice, preden nadaljujejo s časovno super-ločljivostjo, kar je postopek, poln številnih slabosti.

»Z uvedbo tako prostorskega kot (kar je pomembno) časovnega vzorčenja navzdol in navzgor ter izkoriščanja vnaprej usposobljenega modela difuzije besedila v sliko se naš model nauči neposredno generirati videoposnetek nizke ločljivosti s polno hitrostjo slikanja z njegovo obdelavo. v več prostorsko-časovnih lestvicah,« pojasnjuje poročilo.

Primeri uporabe Googlovega novega modela vključujejo video izdajo, slikanje in stilizirano generiranje, vendar ima še vedno svoje pomanjkljivosti. Medtem ko Lumiere ponuja videoposnetke s polno hitrostjo slike, so ustvarjeni videoposnetki nizke ločljivosti, vendar mu njegova vsestranskost daje prednost pred drugimi akterji v industriji.

Primerjave z video generatorji, kot sta Pika in Runway, uvrščajo Lumiere pred skupino, prvi preizkuševalci pa so to ponudbo pozdravili kot prihodnost video generacije.

Googlovi raziskovalci so Lumiere usposobili s skoraj 40 milijoni besedilnih in video napisov, vendar natančni viri podatkovnih nizov niso znani, saj težave z avtorskimi pravicami še naprej ogrožajo prihodnost nastajajoče tehnologije.

Reševanje debakla z avtorskimi pravicami AI

Odkar je generativna umetna inteligenca postala običajna, je bilo več razvijalcev umetne inteligence vlečenih na sodišče zaradi kršitve avtorskih pravic ustvarjalcev pri usposabljanju njihovih velikih jezikovnih modelov (LLM). Google, Meta (NASDAQ: META), OpenAI in Anthropic postavljajo svojo pravno obrambo na sodiščih po ZDA, zanikajo kakršne koli kršitve in zagovarjajo pošteno uporabo.

Za rešitev težav z avtorskimi pravicami AI je bilo predstavljenih več teorij, vključno s predlagano integracijo modelov s tehnologijo veriženja blokov. Google pravi, da bo zaščitil uporabnike umetne inteligence pred zahtevki tretjih oseb glede avtorskih pravic tako, da bo prevzel odgovornost za pravna tveganja.

Da bi umetna inteligenca (AI) delovala v skladu z zakonodajo in uspevala kljub naraščajočim izzivom, mora integrirati sistem blockchain podjetja, ki zagotavlja kakovost vnosa podatkov in lastništvo – kar ji omogoča, da varuje podatke, hkrati pa zagotavlja nespremenljivost podatkov. Oglejte si pokritost CoinGeeka o tej nastajajoči tehnologiji, če želite izvedeti več zakaj bo Enterprise blockchain hrbtenica AI.

Oglejte si: umetna inteligenca potrebuje blockchain

Ste novi v blockchainu? Če želite izvedeti več o tehnologiji veriženja blokov, si oglejte CoinGeekov razdelek Blockchain za začetnike, najboljši vodnik po virih.

Vir: https://coingeek.com/google-lumiere-text-to-video-generator-is-powered-by-ai/