Kaj Nvidijino novo besedilo v 3D pomeni za inženiring in oblikovanje izdelkov

tl;: Generativni AI se razvija z navdušujočo hitrostjo. Najnovejši algoritem družbe Nvidia pretvori besedilo v 3D mrežo dvakrat hitreje kot projekti, objavljeni pred komaj 2 mesecema. To pomeni, da tehnične zmogljivosti sedaj že presegajo naše zmožnosti dela z njimi.

Prejšnji teden papirja znanstveniki Nvidia so pokazali eksponentno hitrost, s katero se razvija generativni AI prostor. Ta eksplozija dejavnosti – zlasti vidna v zadnjih 9 mesecih – bo vplivala na vse dele življenja, nenazadnje na oblikovanje izdelkov, inženiring in proizvodnjo. Spremembe bodo industrijo rešile strukturnih omejitev v načinu komuniciranja idej, omogočile hitrejše inovacijske cikle in ji na koncu omogočile, da izpolni obljube glede trajnosti.

Primeri mrež iz algoritmov Magic 3D družbe Nvidia Research s pozivi, uporabljenimi za njihovo ustvarjanje.

Nvidia Deep Imagination Research

Ker so nam dolga leta govorili, da bo umetna inteligenca korenito spremenila naš način dela, je malokdo pričakoval, da bo kreativni sektor med njegovimi prvimi žrtvami. Pojav človeku podobnega generatorja besedila GPT-3 leta 2020 je možnosti izostril. Od takrat je bila divja vožnja: DALL-E (pretvorba besedila v sliko), Whisper (prepoznavanje govora) in nazadnje Stable Diffusion (pretvorba besedila v sliko) niso samo povečale zmogljivosti govora in vizualnih orodij AI, ampak tudi zmanjšal vire, potrebne za njihovo uporabo (s 175 milijard parametrov za GPT-3 na 900 milijonov za stabilno difuzijo).

Velikost Stable Diffusion pomeni manj kot 5 GB prostora na disku – lahko deluje na katerem koli prenosniku. Ne samo to; za razliko od OpenAI (ki ga v glavnem financira Microsoft in objavlja GPT-3, DALL-E in Whisper) je Stable Diffusion odprtokoden, kar pomeni, da lahko drugi veliko lažje gradijo na njegovem učenju. To pomeni, da smo priča le začetku inovativnega cikla – kot kaže Nvidijin dokument, nas čaka še veliko več.

Podporniki Stable Diffusion (stability.ai) ta trend še pospešujejo z zagotavljanjem tehnoloških in finančnih nepovratnih sredstev drugim ekipam, ki vodijo raziskovanje v nove smeri. Poleg tega množica projektov omogoča, da so orodja na voljo vse širšemu krogu uporabnikov. Med njimi so vtičniki za Blender, odprtokodno oblikovalsko orodje, in Adobejev lastniški ekvivalent Photoshop. Popoln dostop API do orodij se financira z velikimi dolarji tveganega kapitala, kar pomeni, da bo na stotine milijonov razvijalcev programske opreme, ne le nekaj sto tisoč podatkovnih inženirjev, zdaj ustvarilo lastna orodja na teh algoritmih.

Govor, slike in besedilo so med prvimi vertikalami, ki jih te tehnologije motijo. Toda 3D ne zaostaja. Poleg nišne generativne umetnosti so risanke očitna prva točka uporabe. Že obstaja Pokémon generator, ki temelji na Stable Diffusion. Sledijo vizualni učinki in filmi. Toda številni drugi sektorji bodo verjetno moteni – med njimi tudi notranja oprema z Interiorai.com na čelu.

V vsem tem razburjenju se zdi uporaba inovacij v oblikovanju in inženiringu kot naknadna misel. Kljub temu je verjetno, da bo to območje na koncu najbolj prizadeto. Seveda obstajajo začetni izzivi: Stabilna difuzija in njeni rojaki še niso zelo natančni. To ni problem za risanke, je pa velik izziv za vsak poskus preoblikovanja besedila v popolne 3D geometrije, ki se uporabljajo v industrijskih kontekstih. To je področje, ki je imelo nekaj nastajajočega zanimanja (projekt, imenovan Bits101, je bil uveden v Izraelu leta 2015). To je morda sveti gral industrije, vendar obstaja veliko vmesnih izzivov, ki jih je morda veliko lažje rešiti. Ti vključujejo izboljšano prepoznavanje objektov (algoritem Yolo se že uporablja z velikimi učinki), kar bo privedlo do izboljšanega citiranja in opomb – izboljšanje kakovosti in zmanjšanje napak. Vtičniki bi prav tako morali olajšati uporabo Generative AI za razvoj osnovnih modelov (Primitives), ki jih je nato mogoče nadalje urejati v orodjih za načrtovanje za izboljšanje tolerance glede na zahteve. To je pristop, ki se je že uporabljal v Altairjevem Inspireju, ki je za enako uporabil analizo končnih elementov. Ti primitivi lahko služijo tudi kot sintetična zbirka podatkov označenih modelov, ki jih v industriji 3D CAD primanjkuje. Direktor in ustanovitelj podjetja Physna to poudarja v članku podrobno opisujejo lastne poskuse uporabe teh novih metod za ustvarjanje podrobnih 3D-zasnov, kar prav tako poudarja številne pasti pri uporabi sintetičnih podatkov za poganjanje teh algoritmov. knjižnica obrabe orodij za določitev najboljših strategij obdelave.

Ti izzivi so pomembni in donosni za reševanje sami po sebi. Vendar bo njihov glavni učinek pomoč pri razvoju poti od ideje do oblikovanja s končnim zmanjšanjem zanašanja na 3D-zasnove za sporočanje namere. Dizajni, bodisi 2D ali 3D, so služili kot primarno sredstvo za prenos potreb strank v končne izdelke. To omejuje industrijo, ker te zasnove služijo kot črna skrinjica, v kateri so shranjeni vsi ti dragoceni vpogledi strank, proizvodne omejitve in cilji podjetja, ki jih ni mogoče razvozlati, a jih je samo identificirati. To pomeni, da ko se nekaj spremeni, je skoraj nemogoče preprosto prilagoditi dizajn. To je razlog, da proizvodne inovacije, kot je 3D-tiskanje, potrebujejo tako dolgo časa, da se sprejmejo in vedno znova razočarajo kratkoročne vlagatelje. Komponente, ki sestavljajo letalo, so »nastavljene« od trenutka, ko so zasnovane, kljub 20-letni in produktivni življenjski dobi. Inovacij skorajda ni – te morajo počakati na lansiranje naslednje generacije.

Zmožnost spreminjanja ene same omejitve in dovolitev algoritmu, kot je Stable Diffusion, da rekonstruira konstrukcijske in proizvodne parametre, bo bistveno pospešila sprejemanje novih inovacij in nam omogočila, da hitreje izdelamo lažje in zmogljivejše izdelke. Kot to počnejo v formuli 1 ali sistemskem oblikovanju, bodo bodoči inženirji delovali kot upravitelji omejitev, ki bodo lahko z besedami in s sklicevanjem na vire podatkov izrazili, kaj so cilji in omejitve izdelka.

Brez pospešitve inženirskega procesa za nove in obstoječe izdelke na ta način nimamo skoraj nobenega načina za doseganje ambicioznih trajnostnih ciljev, ki si jih moramo zastaviti. Da bi to naredili, se moramo najprej dogovoriti o jeziku, ki ga lahko uporabljamo za komuniciranje onkraj načrtov. Ta novi semantični model je očitna vrzel v zgoraj opisanih inovacijah. Številna podjetja so že začela eksperimentirati z njim, kot npr nTopologija s svojimi koncepti polj. In vendar je tempo sprememb počasen, za razliko od algoritmov, ki jih bo hranil semantični model. Nvidijin novi algoritem naj bi bil več kot dvakrat hitrejši od DreamFusion, objavljeno pred manj kot 2 mesecema. Podjetja za izdelke in inženiring se morajo zdaj ukvarjati z zajemanjem svojih idej na nove načine, ki so pripravljeni na prihodnost, da bi čim bolje izkoristili možnosti, ki jih ponuja ta eksplozija generativne umetne inteligence. Hitrost spreminjanja algoritmov je še enkrat pokazala, da Morsejev zakon velja povsod, kjer se orodja digitalizirajo. Izziv ostaja naša človeška nezmožnost, da bi sprejeli to spremembo in uvedli nove komunikacijske metode, ki bi lahko sprostile svoj potencial, kljub nujnosti naloge.

Vir: https://www.forbes.com/sites/andrewegner/2022/11/24/what-nvidias-new-text-to-3d-means-for-engineering–product-design/