ChatGPT V4 pārspēj SAT un var identificēt izmantojumus ETH līgumos

GPT-4, jaunākā mākslīgā intelekta (AI) tērzēšanas robota ChatGPT versija, var nokārtot vidusskolas testus un juridisko skolu eksāmenus ar rezultātu 90. procentilē, un tai ir jaunas apstrādes iespējas, kas nebija iespējamas ar iepriekšējo versiju.

GPT-4 testa rezultātu skaitļus 14. martā kopīgoja tā veidotājs OpenAI, atklājot, ka tas var arī pārveidot attēlu, audio un video ievades tekstu, kā arī radošāk un uzticamāk apstrādāt “daudz niansētākus norādījumus”.

"Tas nokārto simulētu bāra eksāmenu ar rezultātu aptuveni 10% labāko testa kārtotāju," piebilda OpenAI. “Turpretim GPT-3.5 rezultāts bija aptuveni zemākie 10%.

Skaitļi liecina, ka GPT-4 LSAT eksāmenā sasniedza 163 punktus 88. procentilē — testu koledžas studentiem ir jānokārto Amerikas Savienotajās Valstīs, lai viņi tiktu uzņemti tiesību zinātnē.

*GPT-4 un GPT-3.5 eksāmenu rezultāti virknē jaunāko ASV eksāmenu. Avots:* *OpenAI*

GPT4 rezultāts būtu labs, lai tiktu uzņemts 20 labāko tiesību zinātņu augstskolā, un tikai dažas atzīmes pietrūkst no ziņotajiem punktiem, kas nepieciešami, lai uzņemtu tādas prestižas skolas kā Hārvarda, Stenforda, Prinstona vai Jēla.

Iepriekšējā ChatGPT versija ieguva tikai 149 punktus LSAT, ierindojot to zemākajā 40%.

GPT-4 ieguva arī 298 no 400 punktiem vienotajā advokātu eksāmenā — testā, ko veica nesen absolvējuši tiesību zinātņu studenti, ļaujot viņiem praktizēt kā juristam jebkurā ASV jurisdikcijā.

*Lai praktizētu jurisprudencē katrā ASV jurisdikcijā, bija jāiegūst UBE rezultāti. Avots:* *Nacionālā juristu eksaminētāju konference*

ChatGPT vecajai versijai šajā testā bija grūtības, ierindojoties 10% zemākajā vietā ar rezultātu 213 no 400.

Kas attiecas uz SAT uz pierādījumiem balstīto lasīšanas un rakstīšanas un SAT matemātikas eksāmenu, ko kārtoja ASV vidusskolēni, lai novērtētu savu gatavību koledžai, GPT-4 tika iegūts attiecīgi 93. un 89. procentilē.

GPT-4 bija izcils arī “smagajās” zinātnēs, sasniedzot krietni virs vidējās procentiles AP bioloģijā (85–100%), ķīmijā (71–88%) un fizikā 2 (66–84%).

Tomēr tā AP Calculus rezultāts bija diezgan vidējs, ierindojoties no 43. līdz 59. procentilei.

Vēl viena joma, kurā trūka GPT-4, bija angļu literatūras eksāmenos, 8.–44. procentilē ievietojot rezultātus divos atsevišķos testos.

OpenAI teica, ka GPT-4 un GPT-3.5 kārtoja šos testus no 2022.–2023. gada prakses eksāmeniem un ka valodas apstrādes rīki nav izgājuši “nekādu īpašu apmācību”.

"Mēs neveicām īpašu apmācību šiem eksāmeniem. Mazāko daļu no eksāmenu problēmām modele redzēja apmācības laikā, taču mēs uzskatām, ka rezultāti ir reprezentatīvi.

Rezultāti izraisīja bailes arī Twitter kopienā.

Saistītie: Kā ChatGPT ietekmēs Web3 vietu? Nozares atbildes

Niks Almonds, FactoryDAO dibinātājs teica viņa 14,300 14 Twitter sekotāju 4. martā, ka GPTXNUMX gatavojas “nobiedēt cilvēkus” un tas “sabruks” globālās izglītības sistēmu.

Vērtēšanas teorija vairākus gadus bija liela manas dzīves daļa. Pirms daudziem gadiem es jau domāju par šo dienu. Es burtiski izklausījos pēc rezidenta kloķa tajā laikā.
Bet... patiesībā tas nozīmē, ka no šī brīža viss, izņemot uzraudzītu novērtējumu, ir beidzies.
— dzēriens ️² (@DrNickA) Marts 14, 2023

Bijušais Coinbase direktors Konors Grogans sacīja, ka GPT-4 ievietojis Ethereum viedo līgumu un uzreiz norādīja uz vairākām "drošības ievainojamībām" un izklāstīja, kā kodu var izmantot:

Es ievietoju Ethereum līgumu tiešsaistē GPT-4.
Vienā mirklī tas iezīmēja vairākas drošības ievainojamības un norādīja uz virsmas apgabaliem, kur līgumu varētu izmantot. Pēc tam tika pārbaudīts konkrēts veids, kā es varu izmantot līgumu pic.twitter.com/its5puakUW
— Konors (@jconorrogan) Marts 14, 2023

Agrākie ChatGPT viedo līgumu auditi atklāja, ka tā pirmā versija arī varēja saprātīgā mērā atklāt koda kļūdas.

Rovans Čeungs, mākslīgā intelekta informatīvā izdevuma “The Rundown” dibinātājs, kopīgoja video, kurā GPT tiek pārrakstīta ar roku zīmēta viltota vietne uz papīra lapas kodā.

Es tikko noskatījos, kā GPT-4 pārvērš ar roku zīmētu skici funkcionālā tīmekļa vietnē.
Tas ir ārprāts. pic.twitter.com/P5nSjrk7Wn
— Rowan Cheung (@rowancheung) Marts 14, 2023