GPT-4, najnovejša različica klepetalnega robota za umetno inteligenco (AI), ChatGPT, lahko opravi srednješolske teste in izpite na pravni fakulteti z rezultati, ki se uvrstijo v 90. percentil, in ima nove zmožnosti obdelave, ki niso bile mogoče s prejšnjo različico.
Številke iz testnih rezultatov GPT-4 je 14. marca delil njegov ustvarjalec OpenAI, ki je razkril, da lahko pretvori tudi slikovne, avdio in video vnose v besedilo poleg tega, da bolj ustvarjalno in zanesljivo obravnava "veliko bolj niansirana navodila".
"Opravi simulirani pravosodni izpit z rezultatom okoli 10 % najboljših udeležencev," je dodal OpenAI. "V nasprotju s tem je bil rezultat GPT-3.5 okoli spodnjih 10 %."
Številke kažejo, da je GPT-4 dosegel rezultat 163 v 88. percentilu na izpitu LSAT – test, ki ga morajo opraviti študenti v Združenih državah, da so sprejeti na pravno fakulteto.
Rezultat GPT4 bi bil v dobrem položaju za sprejem med 20 najboljših pravnih fakultet in je le nekaj točk manj od prijavljenih rezultatov, potrebnih za sprejem na prestižne šole, kot so Harvard, Stanford, Princeton ali Yale.
Prejšnja različica ChatGPT je dosegla samo 149 točk na LSAT, kar jo je uvrstilo med spodnjih 40 %.
GPT-4 je prav tako dosegel 298 od 400 točk na enotnem pravosodnem izpitu – testu, ki so ga opravili nedavno diplomirani študenti prava in jim omogoča opravljanje odvetniške prakse v kateri koli jurisdikciji ZDA.
Stara različica ChatGPT je imela težave pri tem testu in se je uvrstila med zadnjih 10 % z rezultatom 213 od 400.
Kar zadeva izpite SAT Evidence-Based Reading & Writing in SAT Math, ki so jih opravljali ameriški srednješolci, da bi izmerili svojo pripravljenost na fakulteto, je GPT-4 dosegel 93. oziroma 89. percentil.
GPT-4 je blestel tudi v "težkih" vedah, saj je dosegel precej nadpovprečne percentilne rezultate pri biologiji AP (85-100 %), kemiji (71-88 %) in fiziki 2 (66-84 %).
Vendar pa je bila njegova ocena AP Calculus precej povprečna in se je uvrščala med 43. in 59. percentil.
Drugo področje, kjer je GPT-4 manjkal, so bili izpiti iz angleške književnosti, kjer so objavljali rezultate v 8. do 44. percentilu na dveh ločenih testih.
OpenAI je dejal, da sta GPT-4 in GPT-3.5 opravila te teste iz praktičnih izpitov 2022-2023 in da orodja za jezikovno obdelavo niso opravila "brez posebnega usposabljanja":
»Za te izpite nismo imeli posebnega usposabljanja. Manjši del težav pri izpitih je model opazil med usposabljanjem, vendar menimo, da so rezultati reprezentativni.«
Rezultati so vzbudili strah tudi v skupnosti Twitterja.
Povezano: Kako bo ChatGPT vplival na prostor Web3? Odgovori industrije
Nick Almond, ustanovitelj FactoryDAO Rekel njegovih 14,300 sledilcev na Twitterju 14. marca, da bo GPT4 "prestrašil ljudi" in "zrušil" globalni izobraževalni sistem.
Teorija ocenjevanja je bila nekaj let velik del mojega življenja. Pred mnogimi leti sem razmišljal o tem, da prihaja ta dan. Takrat sem dobesedno zvenel kot rezident.
Toda ... to v resnici pomeni, da je od te točke naprej konec vsega razen opazovanega ocenjevanja.
— drnick ️² (@DrNickA) Marec 14, 2023
Nekdanji direktor Coinbase, Conor Grogan, je dejal, da je v GPT-4 vstavil živo pametno pogodbo Ethereum in takoj opozoril na več "varnostnih ranljivosti" ter opisal, kako je mogoče kodo izkoristiti:
Živo pogodbo Ethereum sem odložil v GPT-4.
V trenutku je izpostavil številne varnostne ranljivosti in pokazal površine, kjer bi lahko pogodbo izkoristili. Nato je preveril poseben način, kako lahko izkoristim pogodbo pic.twitter.com/its5puakUW
— Conor (@jconorgrogan) Marec 14, 2023
Prejšnje revizije pametnih pogodb na ChatGPT so pokazale, da je bila tudi njegova prva različica sposobna v razumni meri odkriti napake kode.
Rowan Cheung, ustanovitelj glasila AI »The Rundown«, je delil videoposnetek GPT, ki prepisuje ročno narisano lažno spletno stran na kos papirja v kodo.
Pravkar sem gledal, kako GPT-4 spreminja ročno narisano skico v delujočo spletno stran.
To je noro. pic.twitter.com/P5nSjrk7Wn
— Rowan Cheung (@rowancheung) Marec 14, 2023
Vir: https://cointelegraph.com/news/chatgpt-v4-aces-the-bar-sats-and-can-identify-exploits-in-eth-contracts