Pētnieki novērtē ChatGPT sniegumu medicīnisko kopsavilkumu apkopošanā

Nesenā pētījumā, kas publicēts žurnālā The Annals of Family Medicine, pētnieki novērtēja Chat Generatīvā iepriekš apmācītā transformatora (ChatGPT) efektivitāti, apkopojot medicīniskos kopsavilkumus, lai palīdzētu ārstiem. Pētījuma mērķis bija noteikt ChatGPT ģenerēto kopsavilkumu kvalitāti, precizitāti un neobjektivitāti, sniedzot ieskatu par tā potenciālu kā līdzekli liela daudzuma medicīniskās literatūras sagremošanai, ņemot vērā laika ierobežojumus, ar kuriem saskaras veselības aprūpes speciālisti.

Augsti kvalitātes un precizitātes vērtējumi

Pētījumā tika izmantots ChatGPT, lai apkopotu 140 medicīniskos kopsavilkumus no 14 dažādiem žurnāliem, samazinot saturu vidēji par 70%. Neskatoties uz dažām neprecizitātēm un halucinācijām, kas tika atklātas nelielā kopsavilkumu daļā, ārsti novērtēja kopsavilkumus par augstu kvalitāti un precizitāti. Rezultāti liecina, ka ChatGPT var palīdzēt ārstiem efektīvi pārskatīt medicīnisko literatūru, piedāvājot kodolīgus un precīzus kopsavilkumus, ņemot vērā milzīgo informācijas apjomu.

Pētnieki atlasīja 10 rakstus no katra no 14 žurnāliem, kas aptver dažādas medicīnas tēmas un struktūras. Viņi uzdeva ChatGPT apkopot šos rakstus un novērtēja izveidoto kopsavilkumu kvalitāti, precizitāti, neobjektivitāti un atbilstību desmit medicīnas jomās. Pētījumā konstatēts, ka ChatGPT veiksmīgi saīsināja medicīnas kopsavilkumus vidēji par 70%, iegūstot augstus ārstu recenzentu vērtējumus par kvalitāti un precizitāti.

Ietekme uz veselības aprūpi

Neskatoties uz augstajiem vērtējumiem, pētījums atklāja nopietnas neprecizitātes un halucinācijas nelielā skaitā kopsavilkumu. Šīs kļūdas svārstījās no izlaistiem kritiskiem datiem līdz nepareizai pētījumu plānu interpretācijai, kas potenciāli varētu mainīt pētījumu rezultātu interpretāciju. Tomēr ChatGPT veiktspēja medicīnisko kopsavilkumu apkopošanā tika uzskatīta par uzticamu, un tika novērota minimāla novirze.

Lai gan ChatGPT demonstrēja spēcīgu saskaņošanu ar cilvēku novērtējumiem žurnālu līmenī, tā veiktspēja, nosakot atsevišķu rakstu atbilstību konkrētām medicīnas specialitātēm, nebija tik iespaidīga. Šī neatbilstība iezīmēja ierobežojumus ChatGPT spējai precīzi noteikt atsevišķu rakstu atbilstību plašākā medicīnas specialitāšu kontekstā.

Pētījums sniedz vērtīgu ieskatu AI, īpaši ChatGPT, potenciālā, palīdzot ārstiem efektīvi pārskatīt medicīnisko literatūru. Lai gan ChatGPT ir daudzsološs, apkopojot medicīniskos kopsavilkumus ar augstu kvalitāti un precizitāti, ir nepieciešami turpmāki pētījumi, lai novērstu ierobežojumus un uzlabotu tā veiktspēju konkrētos medicīnas kontekstos.

Turpmākie pētījumi varētu būt vērsti uz ChatGPT spēju atpazīt atsevišķu rakstu atbilstību konkrētām medicīnas specialitātēm. Turklāt centieni mazināt neprecizitātes un halucinācijas ģenerētajos kopsavilkos varētu vēl vairāk uzlabot AI rīku lietderību veselības aprūpes iestādēs.

Avots: https://www.cryptopolitan.com/chatgpt-in-summarizing-medical-abstracts/