ChatGPT V4 dosega lestvico, SAT in lahko prepozna izkoriščanja v pogodbah ETH

GPT-4, najnovejša različica klepetalnega robota za umetno inteligenco (AI), ChatGPT, lahko opravi srednješolske teste in izpite na pravni fakulteti z rezultati, ki se uvrstijo v 90. percentil, in ima nove zmožnosti obdelave, ki niso bile mogoče s prejšnjo različico.

Številke iz testnih rezultatov GPT-4 je 14. marca delil njegov ustvarjalec OpenAI, ki je razkril, da lahko pretvori tudi slikovne, avdio in video vnose v besedilo poleg tega, da bolj ustvarjalno in zanesljivo obravnava "veliko bolj niansirana navodila".

"Opravi simulirani pravosodni izpit z rezultatom okoli 10 % najboljših udeležencev," je dodal OpenAI. "V nasprotju s tem je bil rezultat GPT-3.5 okoli spodnjih 10 %."

Številke kažejo, da je GPT-4 dosegel rezultat 163 v 88. percentilu na izpitu LSAT – test, ki ga morajo opraviti študenti v Združenih državah, da so sprejeti na pravno fakulteto.

Rezultati izpitov GPT-4 in GPT-3.5 na vrsti nedavnih izpitov v ZDA. Vir: OpenAI

Rezultat GPT4 bi bil v dobrem položaju za sprejem med 20 najboljših pravnih fakultet in je le nekaj točk manj od prijavljenih rezultatov, potrebnih za sprejem na prestižne šole, kot so Harvard, Stanford, Princeton ali Yale.

Prejšnja različica ChatGPT je dosegla samo 149 točk na LSAT, kar jo je uvrstilo med spodnjih 40 %.

GPT-4 je prav tako dosegel 298 od 400 točk na enotnem pravosodnem izpitu – testu, ki so ga opravili nedavno diplomirani študenti prava in jim omogoča opravljanje odvetniške prakse v kateri koli jurisdikciji ZDA.

Rezultati UBE so bili potrebni za sprejem v odvetništvo v vsaki jurisdikciji ZDA. Vir: Državna konferenca pravosodnih izpraševalcev

Stara različica ChatGPT je imela težave pri tem testu in se je uvrstila med zadnjih 10 % z rezultatom 213 od 400.

Kar zadeva izpite SAT Evidence-Based Reading & Writing in SAT Math, ki so jih opravljali ameriški srednješolci, da bi izmerili svojo pripravljenost na fakulteto, je GPT-4 dosegel 93. oziroma 89. percentil.

GPT-4 je blestel tudi v "težkih" vedah, saj je dosegel precej nadpovprečne percentilne rezultate pri biologiji AP (85-100 %), kemiji (71-88 %) in fiziki 2 (66-84 %).

Rezultati izpitov GPT-4 in GPT-3.5 na vrsti nedavnih izpitov v ZDA. Vir: OpenAI.

Vendar pa je bila njegova ocena AP Calculus precej povprečna in se je uvrščala med 43. in 59. percentil.

Drugo področje, kjer je GPT-4 manjkal, so bili izpiti iz angleške književnosti, kjer so objavljali rezultate v 8. do 44. percentilu na dveh ločenih testih.

OpenAI je dejal, da sta GPT-4 in GPT-3.5 opravila te teste iz praktičnih izpitov 2022-2023 in da orodja za jezikovno obdelavo niso opravila "brez posebnega usposabljanja":

»Za te izpite nismo imeli posebnega usposabljanja. Manjši del težav pri izpitih je model opazil med usposabljanjem, vendar menimo, da so rezultati reprezentativni.«

Rezultati so vzbudili strah tudi v skupnosti Twitterja.

Povezano: Kako bo ChatGPT vplival na prostor Web3? Odgovori industrije

Nick Almond, ustanovitelj FactoryDAO Rekel njegovih 14,300 sledilcev na Twitterju 14. marca, da bo GPT4 "prestrašil ljudi" in "zrušil" globalni izobraževalni sistem.

Nekdanji direktor Coinbase, Conor Grogan, je dejal, da je v GPT-4 vstavil živo pametno pogodbo Ethereum in takoj opozoril na več "varnostnih ranljivosti" ter opisal, kako je mogoče kodo izkoristiti:

Prejšnje revizije pametnih pogodb na ChatGPT so pokazale, da je bila tudi njegova prva različica sposobna v razumni meri odkriti napake kode.

Rowan Cheung, ustanovitelj glasila AI »The Rundown«, je delil videoposnetek GPT, ki prepisuje ročno narisano lažno spletno stran na kos papirja v kodo.