MacWhisper ir bezmaksas transkripcijas programmatūra, ko esmu gaidījis

Vai meklējat Mac programmatūru, lai pārrakstītu audio failus rakstītos teksta failos? Ir daudz maksas rīku, piemēram, Otter.ai un Trint, kas var maksāt reālu naudu, ja sākat tos izmantot pārāk daudz. Bet MacWhisper ir bezmaksas risinājums, ko internets ir gaidījis. Vai vismaz tas, kuru es gaidīju.

OpenAI 2022. gada septembrī izlaida neticami jaudīgu bezmaksas programmu, kas ļāva cilvēkiem ar zināmām tehnoloģijām pārvērst savus audio un video failus neticami precīzos atšifrējumos. Problēma bija tā, ka tā nebija ļoti pieejama vidusmēra lietotājam, jo ​​jums bija jāpārzina komandu lietošana termināļa lietotnē.

Bet ar MacWhisper, kuru pirmais pamanīja 9to5Mac, kāds beidzot ir izstrādājis GUI jeb grafisko lietotāja interfeisu, kas ir balstīts uz OpenAI Whisper un atstāj visas mulsinošās tehniskās lietas zem pārsega, ļaujot vienkārši vilkt un nomest audio failu un ļoti ātri iegūt transkripciju. Un MacWhisper ir ārkārtīgi precīzs, jo OpenAI Whisper ir apmācīts 680,000 stundas audio datus tīmeklī.

Viena no MacWhisper jaukajām lietām ir tā, ka jūs neaugšupielādējat audio vai video failu, kuru vēlaties pārrakstīt internetā. Tas ir svarīgi žurnālistiem, kuri, iespējams, strādā pie sensitīva sižeta, vai ikvienam, kurš parasti uztraucas par savu personīgo failu augšupielādi mākonī. Fails paliek jūsu darbvirsmā, kas nozīmē, ka nav iespējams, ka kāds varētu pārtvert jūsu audio.

Atkal, MacWhisper ir tikai jauns lietotāja interfeiss bezmaksas programmai, ko OpenAI ieviesa pagājušā gada beigās, taču tas patiešām padarīs audio transkripciju vienkāršu gandrīz ikvienam. Jo es izmantoju Whisper un esmu atklājis, ka tas ir ārkārtīgi noderīgs kopš tā izlaišanas. Un pat es tagad izmantošu MacWhsiper, jo tas noteikti paātrinās manu darbplūsmu.

Kā vienu piemēru var minēt, ka pēc ziņām par kriptovalūtu uzņēmuma FTX sabrukumu es izmantoju Whisper, lai pārrakstītu desmitiem stundu vecas YouTube intervijas ar uzņēmuma dibinātāju Semu Bankmanu-Frīdu. No turienes es varēju meklēt stenogrammas un atrast dīvainas un interesantas idejas rakstiem, piemēram, kad SBF 2021. gada jūnijā teica, ka blockchain būtu salabojis Enron. SBF salīdzinājums ar Enron bija dīvaina sakritība, ņemot vērā visu, ko mēs tagad zinām par FTX sabrukumu. Bet es nekad nebūtu atradis šo brīdi vecā neskaidrā intervijā, ja man nebūtu pieejami desmitiem atšifrējumu, kurus varētu meklēt. Un šis process, lai arī vieglāk nekā klausīties stundām ilgi ilgas lentes, joprojām bija neveikls un ne pārāk automatizēts.

Pēc Whisper instalēšanas savā datorā es ikreiz, kad vēlējos pārrakstīt failu, Mac datora termināļa lietotnē ierakstīju “whisper audiofilename.mp3 —model tiny.en”. Izmantojot WhisperMac, es varu vienkārši vilkt un nomest savu audio failu, un tas darbojas bez papildu rakstīšanas.

Es izmēģināju MacWhisper ar NBC Nightly News sēriju, ko lejupielādēju no YouTube. Un ja neskaita dažas kļūdas, piemēram, vārda “windchills” interpretāciju kā “windshills” un Lestera Holta dzirdēšanu kā “Lester Hold”, stenogramma bija ļoti precīza. MacWhisper ir bezmaksas, taču ir maksas programmatūras līmenis, kas varētu būt nedaudz precīzāks, jo tajā tiek izmantoti OpenAI intensīvākie apmācības modeļi, taču bezmaksas versija darbosies lieliski lielākajai daļai cilvēku.

MacWhisper ļauj eksportēt pārrakstīto vārdu dažos dažādos formātos, ieskaitot vienkāršu tekstu, CSV vai pat subtitru faila formātu, piemēram, SRT un VTT.

Un MacWhisper nav paredzēts tikai angļu valodai. Varat pārrakstīt audio 100 dažādās valodās, kas ir neticami ērti. Vienīgā MacWhisper funkcija, ar kuru man patika spēlēt Whisper lietotnē Terminal, ir valodas tulkošana. Esmu tulkojis vīrusu videoklipus krievu un ķīniešu valodā, un cilvēki, kas runā šajās valodās pakalpojumā Twitter, ir teikuši, ka tulkojumi ir precīzs.

Otra funkcija, kuras MacWhisper nav, lai gan tā arī nav pieejama no OpenAI's Whisper, ir iespēja atšķirt skaļruņus. Piemēram, ja transkribējat interviju ar diviem runātājiem, nav skaidru atzīmju, kas parādītu, kad viens runātājs ir apstājies un otrs ir sācis. Bet man ir aizdomas, ka kāds galu galā izveidos šo iespēju. Maksas pakalpojumi, piemēram, Trint, to dara automātiski, un būtu lieliski, ja galu galā tie būtu pieejami bez maksas, taču jūs saņemat to, par ko maksājat.

Programmā MacWhisper ir arī funkcija, kurā varat pārvērst runu no datora mikrofona tekstā, kas varētu būt noderīga, ja vēlaties kaut ko pārrakstīt lidojuma laikā.

Es pavadīju mēnešus, domājot, kad kāds beidzot izstrādās Whisper GUI, jo daži cilvēki to izmēģināja, taču neko īpaši lietotājam draudzīgu neizveidoja. Bet MacWhisper, kuru izstrādāja Jordi Bruin, ir programmatūra, kuru es gaidīju. Bruin ir izstrādājis arī tādu programmatūru kā MacGPT, kas ļauj lietotājiem piekļūt ChatGPT no izvēlnes joslas.

Jūs varat lejupielādēt MacWhisper par brīvu, ar reģistrāciju e-pastā, Bruin vietnē.

Avots: https://www.forbes.com/sites/mattnovak/2023/02/04/macwhisper-is-the-free-transcription-software-ive-been-waiting-for/