„MateCAT“: tegu verčia mašina

Technologijos „MateCAT“: tegu verčia mašina...

Prieš porą metų didžiausias įžeidimas vertėjui būtų pasakyti, kad tekstas yra verstas su „Google Translator“. Dabar tai – kasdienybė. Iš tiesų, programinis (mašininis) vertimas gali būti medinis – nepaisantis linksnių, veiksmažodžių formų ir paprasčiausios logikos. Bet tuo pačiu jis gali būti išsigelbėjimas patyrusiam vertėjui, kurio atminties ištekliai, skirtingai nei kompiuterio, yra riboti. Apie pačius mašininio vertimo subtilumus pakalbėsime kitą kartą, o šiame straipsnyje noriu supažindint su viena paprasčiausių ir vartotojui draugiškiausia (beigi nemokama) vertimo programa „MateCAT“.

Taigi kas tas CAT, ir su kuo jis yra valgomas? CAT arba Computer-Assisted Translation yra vertimo procesas, kai vertėjui talkina tam tikslui sukurta programinė įranga. Pačių programų spektras yra išties platus, nuo vertimo atminties (translation memory) modulių, kurie atsimena kiekvieną žmogaus išverstą sakinį, iki mašininio vertimo (machine translation) įrankių, pusiau-automatiniu būdu verčiančių originalo tekstą.

Rimtieji CAT programų paketai, kaip kad rinkos standartu laikomas „Trados“, yra galingi, bet tuo pačiu neįperkami pradedantiesiems vertėjams. Tuo tarpu mano pristatomas „MateCAT“ yra nemokamas atviro kodo projektas, net nereikalaujantis diegimo – įrankis veikia „Google Chrome“ naršyklėje!

„MateCAT“ toks paprastas naudoti, kad užtenka pažiūrėti penkių minučių trukmės filmuką. Iš esmės, nereikia net jo.

MateCAT veikia panašiu principu, kaip ir profesionalų naudojamos programos: prieš pradedant versti, tekstas yra suskaidomas į segmentus, kurie dažniausiai atitinka sakinius arba kitus loginius vienetus. Segmentavimas padeda žmogui ir programai užtikrinti, kad vienodos originalo vietos būtų verčiamos taip pat. Tai ypač praverčia dirbant su ilgesniais tekstais, instrukcijomis, sutartimis.

„MateCAT“ taip pat palaiko daugiau nei tuziną mašininio vertimo modulių, veikiančių neblogai arba beveik tobulai, priklausomai nuo kalbų kombinacijos ir teksto sudėtingumo. Programai kur kas paprasčiau išversti dviejų žodžių frazę, nei penkių eilučių sakinį. Aišku, programa gali ir suklysti, nes, pavyzdžiui, iš konteksto ištraukta frazė open door gali reikšti ir „atidaryti duris“, ir „atidarytos durys“.

Programa mokosi iš žmogaus, įsimindama, kaip jis verčia. Algoritmas sprendžia, kuris iš galimų vertimo variantų – esantis duomenų bazėje ar sugeneruotas mašininio vertimo modulio – tinka labiausiai, ir pagal tai siūlo vertėjui rinktis iš kelių variantų. „MateCAT“ atveju kaupiama bendra vertimo atmintis, o tai reiškia, kad vienam TECHO.lt skaitytojui išvertus šį straipsnį, kitam nereikėtų vargti, nes sistema įsimintų visus išverstus sakinius.

Kol internete plinta pranašystės apie tai, kaip robotai atims darbus iš mūsų visų (įskaitant vertėjus), „MateCAT“ kūrėjai išpažįsta kitokią filosofiją, įsivaizduodami ateitį, kurioje kompiuteriai ir žmonės dirba ranka rankon. Iš tiesų, suvertus daugumą monotoniškų užduočių kompiuteriui, vertėjui lieka daugiau energijos ir išteklių kūrybos procesui. Pasitelkdami machine learning ir big data principus, programos kūrėjai siekia supaprastinti vertėjo darbą ir sutaupyti laiką – brangiausią XXI amžiaus resursą.

P. S. Smalsiausiems skaitytojams siūlau sumesti šį straipsnį į „MateCAT“ ir pažiūrėti, ar būsite pirmieji, jį išvertę! Programą rasite čia – www.matecat.com.

Techo naujienos į Jūsų el. pašo dėžutę: