Vilniaus universiteto (VU) mokslininkai kartu su partneriais kuria sistemą, sugebančią automatiškai versti tekstus iš 5 kalbų ir į jas.
Neuroninių tinklų technologijas taikanti vertimo sistema bus apmokyta „sumaitinant“ dešimtis milijonų sakinių turinčių tekstų duomenis – iš grožinės, mokslinės literatūros, specializuotų tekstų ir žiniasklaidos šaltinių. Dirbtinis intelektas tokiu būdu ne tik išmoksta išversti pažodžiui, bet ir, įvertinęs kontekstą, gali suteikti verčiamam žodžiui tikslesnę prasmę.
Pasitelkus šią technologiją, bus gerokai patobulinta prieš ketverius metus VU mokslininkų sukurta automatinė vertyklė. Bus įvedamos naujos kalbų poros ir verčiama iš penkių kalbų ir į jas: lietuvių–anglų, lietuvių–prancūzų, lietuvių–rusų, lietuvių–lenkų ir lietuvių–vokiečių.
VU mašininio vertimo grupėje dirba aštuonių žmonių komanda, kuriai vadovauja VU Taikomųjų mokslų instituto mokslininkas dr. Arūnas Samuilis.
„Gyvename dirbtinio intelekto revoliucijos amžiuje, todėl ši technologija yra tinkamiausia automatiniam vertimui. Pasitelkę geriausias vertimo praktikas, apmokysime šį intelektą. Be to, suteiksime jam lokalią terpę – tai yra išmokysime geriau atpažinti Lietuvai būdingą terminiją, informaciją ir jos kontekstą: terminus, sąvokas, vietovardžius, pavardes ir pan. Mūsų tikslas – kad lietuvių kalbos terpėje ši vertyklė verstų net geriau nei „Google“ vertėjas“, – tvirtina dr. A. Samuilis.
Nepriklausoma technologija, valdoma valstybės
Pasak dr. A. Samuilio, ši dirbtiniu intelektu grindžiama vertyklė svarbi ir dėl jos nepriklausomumo. „Jau seniai kalbama, kiek daug svarbių duomenų yra koncentruojama vienos korporacijos rankose. Šis projektas šaliai suteikia galimybę turėti nepriklausomą vertimo sistemą, kuri šimtu procentų yra kontroliuojama valstybės, nešališka ir užtikrinanti, kad duomenys nenutekės į privačių korporacijų rankas“, – teigia mokslininkas.
Projekto įgyvendinimo technologinius darbus atlieka konkursą laimėjusi specializuota kalbos technologijų bendrovė UAB „Tilde IT“. Ji jau anksčiau yra sukūrusi dirbtinio intelekto technologijomis paremtą šnekos atpažintuvą. Šią technologiją planuojama integruoti ir į naująją vertyklę.
Naudojant šią technologiją, bus galima lietuviškai įkalbėti tekstą ir jis bus automatiškai išverstas į prancūzų ar anglų kalbą. „Ši technologija gali būti pritaikyta kad ir universitetų auditorijose – dėstytojas gali įrašyti savo paskaitą lietuviškai ir pateikti jau išverstą tekstą užsienio studentams. Taip pat ji praverstų konferencijų dalyviams, kai pranešimai skaitomi lietuvių kalba, o kitakalbiams nėra galimybės pasinaudoti profesionalių vertėjų pagalba“, – pasakoja vertimo sistemos kūrėjų komandos vadovas.
Plačios pritaikymo galimybės
Pasak projekto kūrėjų, pagrindinė auditorija – gyventojai, kuriems reikia išversti tekstus ar internetinių svetainių turinį į kitas kalbas.
Kaip teigia dr. A. Samuilis, ši vertyklė pravers Lietuvoje gyvenančių tautinių mažumų atstovams, kurie susiduria su sunkumais mėgindami suprasti oficialiose svetainėse skelbiamą informaciją. Naudodami šią vertyklę jie galės lengvai suprasti skaitomą turinį. Taip pat bus patogu versti užklausas (ieškant informacijos) ir gauti paieškos rezultatus norima kalba. „Planuojama, kad vertimo įskiepis bus įdiegtas ir į e. paslaugas teikiančias svetaines, pavyzdžiui, VMI, taip suteikiant galimybę lankytojams informaciją gauti viena iš 5 užsienio kalbų“, – pabrėžia mokslininkas.
Siekiant gauti dar tikslesnį vertimą, vertyklė turės ir 3 specializuotas sistemas: bendrinę, teisinę ir informacinių technologijų. Projekto kūrėjai numato, kad e. vertyklė bus naudinga visiems, kurie dirba su skaitmeniniu turiniu keliomis kalbomis: mokymų kūrėjams, seminarų, renginių ar diskusijų vedėjams ir dalyviams, valstybinėms institucijoms, teisininkams ir kitiems. Ji taip pat bus vertinga klausos negalią turintiems žmonėms, nes garsinius įrašus galės ne tik išversti, bet ir pateikti teksto pavidalu.
E. vertyklė, taupanti laiką
Įkėlus dokumentą į sistemą, bus gaunamas jo išverstas analogas viena iš 5 pasirinktų kalbų. „Kaip ir dabartinėje vertyklėje, bus galimybė versti visą dokumento ar svetainės turinį. Sistema paliks išverstame tekste visus formatavimus – šriftą, paryškinimą, pabrauktus žodžius. Tai didelė pagalba ir tiems, kurie iki šiol tekstus turėdavo išsiversti patys, nes sistema automatiškai atliks pradinį darbą, o vartotojams liks tik redagavimo ir tikslinimo darbas“, – pasakoja vienas programos kūrėjų.
Skaičiuojama, kad dirbtinis intelektas, atlikęs pradinį vertimą, padidina automatinių vertimo sistemų produktyvumą maždaug 15–30 proc., o palyginti su savarankišku vertimu – net 2–3 kartus.
„Tai yra pagalba žmonėms, kurie verčia ilgus tekstus, įstatymus, sutartis – pasitelkus šią technologiją, darbas atliekamas daug greičiau. Kadangi visą „juodąjį“ darbą atlieka technologija, žmogus gali koncentruotis į detales, teksto grožį ir kitus niuansus“, – džiaugiasi dr. A. Samuilis.
Pasak komandos vadovo, dirbtinio intelekto vertimai gali praversti beveik visiems dirbantiems su tekstiniu turiniu keliomis kalbomis – komunikacijos specialistams, žurnalistams, tarptautinių bendrovių darbuotojams. „Žinoma, viso žmogiškojo darbo e. vertyklė neatstos – bet tikrai palengvins ir pagreitins. Dėl šios priežasties daugiau laiko liks kitiems darbams“, – teigia VU mokslininkas.
Projektas finansuojamas ES struktūrinių fondų ir Lietuvos Respublikos lėšomis. Jį planuojama užbaigti iki 2021 m. Į projektą bus investuota 3,8 mln. eurų.
Komentarų: 1
2021-08-06 13:14
noriuTai kur ta vertyklė? pinigus įsisavinote o produkto nėra.