Paaiškino, kodėl iki šiol kompiuteriai nešneka lietuviškai – atskleidė, kada tai pasikeis

Masinė Lietuvos kompiuterizacija įvyko amžių ir tūkstantmečių sandūroje: apie 2000-uosius namų ūkiai ėmė masiškai pirkti kompiuterius, lengvatą jų įsigijimui taikė ir valstybė. Tačiau jau baigiasi antrasis dešimtmetis, šalia stalo ir nešiojamųjų kompiuterių atsirado išmanieji telefonai – ir visus juos sieja viena problema: jie vis dar vargiai supranta ir kalba lietuviškai.

 Netrukus robotukė LIEPA kalbės lietuviškai ir padės mokytojams vesti pamokas.<br> V. Skaraičio nuotr.
 Netrukus robotukė LIEPA kalbės lietuviškai ir padės mokytojams vesti pamokas.<br> V. Skaraičio nuotr.
Kada jau galiausiai susišnekėsime gimtąja kalba su kompiuteriu be klaviatūros, laidoje „#42: Apie gyvenimą, Visatą ir Viską su Adomu Rutkausku“ pasakojo projekto LIEPA kūrėjai Audrius Valotka (viduryje) ir Gediminas Navickas (dešinėje).<br> V. Skaraičio nuotr.
Kada jau galiausiai susišnekėsime gimtąja kalba su kompiuteriu be klaviatūros, laidoje „#42: Apie gyvenimą, Visatą ir Viską su Adomu Rutkausku“ pasakojo projekto LIEPA kūrėjai Audrius Valotka (viduryje) ir Gediminas Navickas (dešinėje).<br> V. Skaraičio nuotr.
 Kada jau galiausiai susišnekėsime gimtąja kalba su kompiuteriu be klaviatūros, laidoje „#42: Apie gyvenimą, Visatą ir Viską su Adomu Rutkausku“ pasakojo projekto LIEPA kūrėjai Audrius Valotka (viduryje) ir Gediminas Navickas (dešinėje).<br> V. Skaraičio nuotr.
 Kada jau galiausiai susišnekėsime gimtąja kalba su kompiuteriu be klaviatūros, laidoje „#42: Apie gyvenimą, Visatą ir Viską su Adomu Rutkausku“ pasakojo projekto LIEPA kūrėjai Audrius Valotka (viduryje) ir Gediminas Navickas (dešinėje).<br> V. Skaraičio nuotr.
 G. Navickas:  Robotukė LIEPA galės mokyti bebūtinai matematiką, tačiau bet kurį dalyką – ateityje ji gali būti pagalbininke mokytojui.<br> V. Skaraičio nuotr.
 G. Navickas:  Robotukė LIEPA galės mokyti bebūtinai matematiką, tačiau bet kurį dalyką – ateityje ji gali būti pagalbininke mokytojui.<br> V. Skaraičio nuotr.
  Netrukus robotukė LIEPA kalbės lietuviškai ir padės mokytojams vesti pamokas.<br> V. Skaraičio nuotr.
  Netrukus robotukė LIEPA kalbės lietuviškai ir padės mokytojams vesti pamokas.<br> V. Skaraičio nuotr.
  Netrukus robotukė LIEPA kalbės lietuviškai ir padės mokytojams vesti pamokas.<br> V. Skaraičio nuotr.
  Netrukus robotukė LIEPA kalbės lietuviškai ir padės mokytojams vesti pamokas.<br> V. Skaraičio nuotr.
  Netrukus robotukė LIEPA kalbės lietuviškai ir padės mokytojams vesti pamokas.<br> V. Skaraičio nuotr.
  Netrukus robotukė LIEPA kalbės lietuviškai ir padės mokytojams vesti pamokas.<br> V. Skaraičio nuotr.
 A. Valotka: priežastis, kodėl robotas kaip daiktas mums taip svarbus – pasaulis juda nuo mūsų technologinės aplinkos valdymo mygtukais, klaviatūra, pelėmis prie valdymo balsu.<br> V. Skaraičio nuotr.
 A. Valotka: priežastis, kodėl robotas kaip daiktas mums taip svarbus – pasaulis juda nuo mūsų technologinės aplinkos valdymo mygtukais, klaviatūra, pelėmis prie valdymo balsu.<br> V. Skaraičio nuotr.
  Netrukus robotukė LIEPA kalbės lietuviškai ir padės mokytojams vesti pamokas.<br> V. Skaraičio nuotr.
  Netrukus robotukė LIEPA kalbės lietuviškai ir padės mokytojams vesti pamokas.<br> V. Skaraičio nuotr.
 Vilniaus universiteto Filologijos fakulteto humanitarinių mokslų daktaras Audrius Valotka.<br> V. Skaraičio nuotr.
 Vilniaus universiteto Filologijos fakulteto humanitarinių mokslų daktaras Audrius Valotka.<br> V. Skaraičio nuotr.
 Vilniaus universiteto Duomenų mokslo ir skaitmeninių technologijų instituto ekspertas Gediminas Navickas.<br> V. Skaraičio nuotr.
 Vilniaus universiteto Duomenų mokslo ir skaitmeninių technologijų instituto ekspertas Gediminas Navickas.<br> V. Skaraičio nuotr.
  Netrukus robotukė LIEPA kalbės lietuviškai ir padės mokytojams vesti pamokas.<br> V. Skaraičio nuotr.
  Netrukus robotukė LIEPA kalbės lietuviškai ir padės mokytojams vesti pamokas.<br> V. Skaraičio nuotr.
  Netrukus robotukė LIEPA kalbės lietuviškai ir padės mokytojams vesti pamokas.<br> V. Skaraičio nuotr.
  Netrukus robotukė LIEPA kalbės lietuviškai ir padės mokytojams vesti pamokas.<br> V. Skaraičio nuotr.
Daugiau nuotraukų (13)

Lrytas.lt

Nov 4, 2019, 8:52 PM, atnaujinta Nov 6, 2019, 10:17 AM

Taip, su tekstine įvestimi jokių bėdų nėra: bet mes vis dar nesusišnekame su kompiuteriais balsu, kai tuo tarpu anglakalbiai tai daro beveik dešimtmetį – nuo tada, kai 2011 m. „Apple“ į savo „iPhone“ integravo virtualųjį asistentą Siri.

Tad kodėl taip yra? Kodėl šnekamoji, balsinė lietuvių kalba niekaip neateina į kompiuteriją, kas daroma, kad tokia situacija pasikeistų ir kada jau galiausiai susišnekėsime gimtąja kalba su kompiuteriu be klaviatūros, laidoje „#42: Apie gyvenimą, Visatą ir Viską su Adomu Rutkausku“ pasakojo projekto LIEPA kūrėjai Vilniaus universiteto Filologijos fakulteto humanitarinių mokslų daktaras Audrius Valotka ir Vilniaus universiteto Duomenų mokslo ir skaitmeninių technologijų instituto ekspertas Gediminas Navickas.

– Pradėkime nuo mūsų žiūrovo Romualdo Strielos klausimo: kodėl LIEPA? Kodėl būtent toks pavadinimas ir ką jis reiškia?

Audrius Valotka: – Atsakymas labai paprastas: tai yra žodžių junginio „Lietuvių šneka valdomos paslaugos“ santrumpa. Trumpa, gražu ir aišku.

– Gerai, tada pagrindinis klausimas: kodėl kompiuteriai dar nešneka lietuviškai? Juk Lietuvos namų kompiuterizacija įsibėgėjo prieš daugmaž 20 metų, o išmanieji telefonai atsirado jau prieš 12?

A.Valotka: – Priežastys yra mažiausiai dvi. Pirmoji – lingvistinė. Lietuvių kalba yra sudėtinga kalba, vien tik daiktavardžiai gali turėti daugiau nei 500 priesagų, o kur dar galūnės. Dėl to kalbos generuojamų vienetų įvairovė yra nepaprastai didelė – apie pusantro milijardo vienetų! Lyginant su paprastesnio sudėtingumo kalba, mums prakalbinti kompiuterį užduotis yra sudėtingesnė.

Antroji priežastis – pinigai. Tai brangiai kainuoja. Pirmasis ir antrasis LIEPOS projektai apima keliolika tūkstančių valandų darbo laiko. Palyginimui – į atviro kodo naršyklės (deja, dabar neatsimenu, kurios) tobulinimą iki šiol yra investuota apie 13 000 darbo metų. Ne dienų, ne valandų, o metų – nors atrodytų, naršyklės juk jau išspręstas technologinis uždavinys, skirtingai nuo šnekos atpažinimo. Taigi, kaltas investicijų kiekis: mažai pinigų – mažai rezultatų.

– O ar nelemia ir tai, kad lietuviškai kalbančių nėra daug?

A.Valotka: – O tai susiję su pinigais (juokiasi). Būtų mūsų milijardas – tų pinigų būtų daugiau.

– Kiek priskaičiuojama vartotojų, kalbančių lietuviškai? Su visais užsienyje gyvenančiais lietuviakalbiais?

A.Valotka: – Trys milijonai. Ką reikia turėti omenyje apie esančius užsienyje – dabar jie dar šneka lietuviškai, bet po daugmaž dviejų kartų ten beveik nebebus lietuviškai kalbančių.

– Bet pažiūrėkime: mes vejamės technologijas (jos kartais tobulėja greičiau už mus), tačiau jaunoji karta jau puikiai kalba angliškai – ir tai apima ir telefono valdymą balsu. Tad ar tikrai LIEPA dar yra reikalinga?

A.Valotka: – Kalba yra ne tik komunikacijos priemonė. Jei kalba būtų vien komunikacijos priemonė, pasaulyje turbūt būtų vienui vienintelė kalba. Viena vėliava. Vienas herbas. Bet kalba yra ir vertybė. Tai yra bene svarbiausias bet kurios tautos atributas. Ir kadangi visa ta vertybinė dalis mums yra labai svarbi, tai yra mūsų tapatybės dalis – tai mes norėtume, kad lietuvių kalba būtų visur, įskaitant ir technologijas.

– Kaip gimė LIEPA? Kokia buvo pati jos pradžia?

A.Valotka: – Didysis idėjų generatorius mūsų komandoje yra profesorius Laimutis Telksnys. Jis jau 50 metų įgyvendina kalbos technologijų idėjas ir manau turi idėjų dar 50 metų į priekį, dabartinėje vietoje jis tikrai nesustos (juokiasi).

Bet viskas prasidėjo nuo paprastesnių dalykų: nuo nedidelių bandymų. Turėkime omenyje, kad LIEPA turi dvi kryptis: šnekos sintezatorius ir šnekos atpažinimas. Šnekos sintezavimo kryptyje darbuojasi docentas Pijus Kasparaitis iš mūsų Matematikos ir informatikos instituto, o atpažinimo grupė – atskira komanda, ir gerokai didesnė. Nes ir užduotis gerokai sunkesnė.

Bet pačios pradžios net ir neprisimenu. Gal Gediminas galėtų pakomentuoti?

Gediminas Navickas: – Kaip ir Audrius sakė, pradžia priklauso nuo to, kaip toli į praeitį pažiūrėsime. Galima sakyti, kad jau yra ir 50 metų – bet čia kaip ir su daugeliu idėjų bei technologinių koncepcijų: buvo idėjos, bet nebuvo priemonių jas realizuoti, buvo silpna skaičiavimo technika ir t.t.

Štai pirmąją LIEPĄ darėme trejus metus, LIEPA-2 darome jau pusantrų metų. Atrodytų jau visai netrumpai, jau skaičiuojame metais – tačiau reikia turėti omenyje, kad visų šių projektų nebūtų jei ne tų keliasdešimties metų įdirbis prieš tai.

O atsakant į pirmąjį klausimą, kodėl atsiliekame – LIEPA ir LIEPA2 yra pirmieji tokie dideli projektai. Čia reikia paminėti, kad kiek teko girdėti, vokiečiai – kurie pagal kalbėtojų skaičių tikrai nėra numeris vienas pasaulyje – prie analogiško kalbos sintezavimo projekto dirbo 30 metų, ir tai darė 30 universitetų. Tuo tarpu mes universitetus skaičiuojame ne dešimtimis, o tas keliasdešimties metų įdirbis, apie kurį kalbėjau – labiau mokslinis, fundamentinis, kai tuo tarpu inžinerinis, atvedantis technologiją iki žmogaus – tik paskutinio dešimtmečio darbai.

– Kiek iš viso žmonių yra dirbę prieš LIEPOS? Ir kiek prie projekto dirba dabar?

A.Valotka: – Galiu visiškai tiksliai pasakyti: šiuo metu prie LIEPOS dirba 37 žmonės. Ne visu etatu – visu etatu dirbančių turbūt nelabai jau ir yra. Bet pavardžių sąraše yra 37.

– O skaičiuojant nuo pradžios?

A.Valotka: – Tiek pirmo, tiek antrojo projekto komandos buvo panašios. Šiek tiek skiriasi atpažinimo grupė, ir garsyno – arba filologų komanda, dabar ji padidėjusi. O šiaip – kertiniai žmonės yra tie patys.

G.Navickas: – Ir tai parodo du dalykus: pirma, kad šnekos atpažinimas ir sintezė yra sritys, kurios reikalauja įvairiausių kompetencijų. Kartais reikia kompetencijos, kurią turi tam tik tikras žmogus, bet nereikia, kad jis dirbtų visu etatu: pakanka kad jis ateitų ir padarytų tam tikrą darbą.

Kitas dalykas – Lietuvoje specialistų nėra daug, ir komandą formuojame iš to, kas yra. Čia vėl atsiremiame į faktą, kad ir kalbėtojų nėra daug, ir šiaip žmonių mažai.

Ir čia yra atsakymas, kodėl tų technologijų nepadaro niekas kitas. Nes mes kartais sulaukiame klausimo – o tai gal kokios komercinės įmonės, gal „Google“ jau padarė? Bet „Google“ dar nepadarė. Ir mes darome tai todėl, kad ir kaip nuviliančiai tai nuskambėtų, Lietuva didiesiems žaidėjams nėra įdomi rinka. Tačiau įdomu tai, kad net ir Švedija – kuri šiaip jau yra labai turtinga šalis – gigantams irgi nėra įdomi rinka. Didieji daro skaičiavimus, tiria rinkas ir nusprendžia, kad tiek Lietuvoje, tiek Švedijoje juk turbūt ir taip angliškai moka, tad kas norės, jau pasinaudos jų paslaugomis.

– O dabar – sudėtingiausias klausimas, į kurį paprašysiu atsakyti kiek įmanoma paprasčiau: kaip veikia LIEPA? Pradėkime gal nuo balso sintezavimo.

G.Navickas: Nesinori leistis į gilius techninius ar inžinerinius reikalus, tai pabandykime taip: pirmiausia įrašomas diktoriaus balsas – keletas valandų kuo gražesnės, lygesnės, taisyklingesnės šnekos. Tada visa ta visa šneka sukarpoma į garsus. Turime duomenų bazę, kurioje, pavyzdžiui, gali būti tūkstantis „a“ garsų. Taip pat ir su „b“ garsu, ir kitais – atitinkamai pagal jų naudojimo dažnį kalboje. Ir su kiekvienu garsu saugome informaciją, iš kur jis paimtas: ar iš sakinio pradžios, ar iš žodžio pradžios, ar jo pabaigos, ar sakinio vidurio ir t.t.

Kai jau paduodame mašinai naują tekstą sintezavimui, mašina pamato, kad tekste yra „a“ raidė – ir paima iš duomenų bazės „a“ raidę, kuri buvo sakinio pradžioje – ir libdo iš tokių garsų visą šneką. O visas tas gudrumas, mokslas ir sudėtingumas šito reikalo yra sujungti tuos garsus taip, kad tarp jų nesijaustų sujungimų – nes žmogaus klausa yra ypatingai jautri. Nes jei žiūrėtume į signalą vizualiai, mes ten nepastebėtume jokių sujungimų – o žmogaus ausis juos užfiksuos, nes mes, žmonės, iš tiesų šnekame labai sklandžiai ir gražiai.

Tuo tarpu šnekos atpažinime garsynas renkamas visiškai priešingu principu. Mūsų tikslas – kad atpažinimas veiktų nepriklausomai nuo kalbėtojo. Kad nesvarbu kas kalbėtų – vyras, moteris, jaunas žmogus, senas – kompiuteris vis tiek atpažintų. Tam reikia surinkti labai didelę šnekos pavyzdžių duomenų bazę iš kuo įvairesnių kalbėtojų – ir tada kompiuteris apmokomas. Jis išmoksta, kaip gali skambėti garsas „a“, išsiveda jo vidurkius, taip pat su garsu „b“ ir kitais, kol galiausiai jis išmoksta iš garso versti į tekstą.

– Puiku, su technologine/programine projekto dalimi aišku. Bet projekte dalyvauja ir filologai. Ką jie ten daro?

A.Valotka: – Bent jau sintezatoriaus darbas prasideda dar anksčiau: reikia sukurti ypatingą tekstą. Ir tą ypatinga tekstą sukūrė berods kolegė profesorė Irena Smetonienė – tekstą, kuriame yra visi įmanomi tarties variantai: dvibalsiai, dvigarsiai, tvirtapradis kirčiavimas, tvirtagalis, nosinis „n“ (kaip žodyje „gongas“), trigarsiai (kaip „duonkepė“) ir kiti.

Kodėl tai labai svarbu? Nes jei per vieną kartą mes to nepadarysime, ir diktorei Reginai Jokubauskaitei sakysime „Regina, pamiršome keletą garsų, būkite gera, dabar po kelerių metų mums įrašykite“, vargu ar mums pavyks tai visiškai švariai padaryti. Geriausia, kai žmogus per vieną kartą prisėda ir kol balsas nepervargęs, viską paskaito. Nes žiemą žmogus gali kalbėti vienaip, vasarą – kitaip.

Na o paskui lingvistų darbas – lyg ir paprastas, bet iš tiesų labai keblus. Turi garso įrašą, ir turi jį apdoroti, anotuoti. Tarp mūsų kalbant, kompiuteris yra kvailas daiktas. Dabar mes kalbame, tai yra šneka, o dabar aš padarysiu taip (pabeldžia į stalą) – ir ar tai yra kalbos elementas, ar ne? Mums aišku, kad ne – o pradinei programos stadijai neaišku. Šuo sulojo, kas nors trinktelėjo į langą, pravažiavo mašina – visokias tokias garso šiukšles kompiuteris turi atskirti ir nebandyti jų prikabinti prie kokio nors teksto.

Kiekvienas žodis karpomas 30 milieskundžių tikslumu, sutvarkomas, sudėliojimas – ir visas šis procesas yra labai imlus, prie to jau beveik dvejus metus dirba devynių žmonių komanda. Per mėnesį žmogui apdoroti dagiau kaip 4-5 valandas tokio įrašo jau yra labai didelis darbas.

Tad lingvistinės žinios svarbios šiuo aspektu, o toliau – kitas dalykas: programos atskiria, kur yra priesaga, kur galūnė, ir atpažinimui visa ši informacija irgi yra labai svarbi. Tad atsakant į klausimą, kada prasidėjo visas šitas grožis – tai viskas prasidėjo nuo XIX a., nuo Augusto Šleicherio lietuvių kalbos tyrinėjimų (juokiasi). Nes fonetinės, morfologinės žinios – išvis kalbos žinios – dabartinėse programose jos visos yra sėkmingai integruojamos ir panaudojamos.

– Kiek žmonių reikia garsyno sukūrimui?

A.Valotka: – Mūsų planas – 1000 valandų įrašo. Pirmoji LIEPA buvo 100 valandų, o dabartinė, antroji – 1000. Nutarėme aplenkti visus kaimynus ir prasiveržti į priekį (juokiasi).

Taip pat norime, kad būtų mažiausiai 2000 skirtingų balsų (o kiekvieno žmogaus balso įrašas trunka 20-30 minučių). Mums reikalinga įvairovė, mums reikia 2000-3000 pagalbininkų.

– Kas gali jais tapti?

A.Valotka: – Jūs. Šios laidos režisierė. Prezidentas Gitanas Nausėda. Bet kas, kas tik norite – visi!

– Ar nėra jokių specialių reikalavimų žmogui, norinčiam prisidėti prie kompiuterių prakalbinimo lietuviškai?

A.Valotka: – Vyrai, moterys, jauni, seni, greitai, lėtai šnekantys – nesvarbu. Svarbu, kad nebūtų labai didelių kalbos defektų.

G.Navickas: – Priešingai sintezatoriui, atpažintuvui labai reikia kuo didesnės įvairovės. Visiškai nereikia taisyklingo kirčiavimo, geros dikcijos, kitų diktoriškų dalykų – nes gyvenimas toks ir yra, kad kompiuteriams teks atpažinti šneką, kuria kalbama ne studijoje, o gyvenime, kuri nebūna diktoriška.

Tad padėti prakalbinti kompiuterius lietuviškai gali bet kas.

Ir galiu pasakyti, kokių balsų mums dabar labiausiai trūksta – tai vaikiškų (todėl visiems ateinantiems sakome – jei turite vaiką, gebantį skaityti, atsiveskite ir jį) ir vyresnio amžiaus vyrų balsų (virš šešiasdešimties metų).

– Gerai, tarkime, kažkas susidomi ir pasiryžta padėti – nuo ko reikėtų pradėti?

G.Navickas: – Reikėtų parašyti laišką adresu lieposdiktoriai@gmail.com. Mūsų kolegės nuolat tikrina šį paštą ir tikrai bus sutartas patogus laikas. Įrašus galima daryti darbo dienomis, galima po darbo, galima šeštadieniais, visas apsilankymas pas mus studijoje senajame gražiajame universiteto pastate truks 30-40 minučių.

– Sakoma, kad lietuvių kalba yra viena sudėtingiausių pasaulyje. Ar tai kartais neprisideda prie tokios lėtos lietuvių kalbos plėtros kompiuterijoje?

A.Valotka: – JAV Gynybos ministerijos Kalbų institutas yra sudaręs sąrašą ir suskirstęs kalbas pagal sudėtingumą, skiltimis. Turiu nuliūdinti, bet lietuvių kalba nėra sudėtingiausių kalbų grupėje – galbūt todėl, kad kalba priklauso indoeuropiečių šeimos grupei, kaip ir anglų kalba. Sudėtingiausiomis laikomos korėjiečių kalbos ir panašios.

Bet lietuvių kalbos sudėtingumas yra jos įvairovė. Kaip minėjau – priesagos, galūnės, kirčiai, priegaidės ir laisva žodžių tvarka.

G. Navickas: – Na o kalbant apie techninę pusę – visos tos techninės ypatybės tampa problemomis ir imantis įgyvendinimo: jei anglų kalboje žodis nelinksniuojamas ir mums tereikia jį vienintelį atpažinti, tai lietuvių kalboje gali būti bent keliasdešimt formų.

– Su kokiais didžiausiais iššūkiais tenka susidurti dabartinėje projekto stadijoje?

G.Navickas: – Problema ta, kad tūkstantis valandų, kalbant apie mašininį mokymą, nėra daug. Bet koks nors „Google“ tiksliai neanotuoja – jis šeria kuo daugiau duomenų ir per tą masę pasiekia rezultatą. Tuo tarpu mes tiesiog fiziškai neturime tokios duomenų masės, nes „Google“ susirenka iš visur, ten yra nesuvokiami informacijos kiekiai.

Kadangi mes šito dalyko brutalia jėga pramušti negalime, tenka padirbėti galva: daugiau aprašyti, įdėti daugiau žinių ir kompiuteriui, jam jau paduoti tas žinias, kad jis galėtų suprasti lietuvių šneką.

Dar vienas nedėkingas dalykas: vienu metu kuriamas ir garsynas, ir atpažintuvas. Bet atpažintuvas bus tuo geresnis, kuo daugiau turėsime surinkto garsyno, o daugiau šio turėsime tik projekto pabaigoje. Tad dabar yra taip, kad šiuo metu kiekvieną dieną galime parodyti vis geresnį rezultatą, bet pats geriausias rezultatas bus tik projekto pabaigoje.

– Teko girdėti, kad LIEPOS garsyno rinkimui buvo naudojami ir Seimo posėdžių įrašai?

G.Navickas: – Seimo posėdžių įrašai buvo naudoti moksliniams tyrimams, kurie vėliau tapo LIEPOS pagrindu. Bet tai yra labai specifinė kalba, tam tikru požiūriu ją atpažinti yra lengviau.

– Gerai, pažiūrėkime į ateitį: ar yra numatytos kokios konkrečios technologijos pritaikymo galybės, po projekto užbaigimo?

G.Navickas: – Šiame projekte numatytos šešios atskiros paslaugos, kurios yra labiau iliustracinės. Šio projekto tikslas – sukurti pagrindą ir postūmį tokių technologijų plitimui. Mes viską, ką sukuriame, atiduodame viešam naudojimui, nemokamai – taip pat ir komerciniams tikslams.

Tad galime atiduoti sintezatorių, kad jį galima būtų internete integruoti į svetainę ir ją perskaityti balsu. Nes patiems tokį kurtis kainuoja ir pinigus, ir laiką – o jau integruotis į savo sistemą nepalyginamai paprastesnis darbas.

Aišku, idėjų yra ir daugiau, bet tikime, kad rinka, žmonės ir kiti programuotojai gali daugiau scenarijų prigalvoti.

– Grįžtant prie LIEPOS – iš profesoriaus L.Telksnio teko girdėti, kad yra minčių lietuvių kalbos atpažinimą diegti į naujus automobilius, palaikančius balso atpažinimą ir valdymą balsu?

G.Navickas: – Taip, bandome susisiekti su vienais gamintojais, bet su verslu kontaktas nelengvas. Ten didelės korporacijos, viskas vyksta lėtai. Bet taip, vienas iš pritaikymų galėtų būti ir toks.

Nes, kaip jau ir kalbėjome, mes gal ir suprantame anglų kalbą – bet jei tai ne gimtoji kalba, šnekame ja ne idealiai, kokio nors tavo ištarto žodžio gali neatpažinti, nors tu ką. Todėl lietuvių kalba čia galėtų būti naudinga.

– Gediminai, vakar tariantis su jumis dėl atvykimo į laidą per „Facebook Messenger“, jūs lyg naudojotės LIEPOS tartuvu? Tai reiškia, kad tokia galimybė jau veikia?

G.Navickas: – Taip, kai kuriais sprendimais jau galima naudotis telefone. Tiesa, tai jau ne vien mūsų, o ir komercinės įmonės produktas, kuriame buvo panaudoti LIEPOS rezultatai. Tad taip, šiandien mes jau galime telefonuose turėti visai padorų lietuvių kalbos atpažinimą ir naudoti bent jau tokiems trumpiems tekstukams, kokie būna susirašinėjimo programėlėse ar trumposiose žinutėse.

Štai pavyzdžiui, neseniai norėjau už automobilio parkavimą sumokėti trumpąja žinute, kur reikia tiesiog parašyti „stop“ ir supratau – juk kaip paprasta ir greita yra tiesiog pasakyti „stop“, o kiek ilgiau tai užtrunka parašyti.

– LIEPA-1 ir LIEPA-2: kuo skiriasi šie projektai?

G.Navickas: – Pirmojoje LIEPOJE daugiausia dirbome su stacionariaisiais įrenginiais, stacionaria terpe ir atitinkamai didesniais skaičiavimo pajėgumais. Antrojoje LIEPOJE jau įpusėjome darbą su mobiliaisiais įrenginiais: mobiliaisiais telefonais, išmaniaisiais laikrodžiais, ir vienu iš mobiliųjų renginių yra edukacinis robotas.

– O ką pas mus studijoje veikia šitas robotas?

G.Navickas: – Šitas robotas mokys vaikus, bus mokytojo pagalbininkas. Jis jau moka šiek tiek kalbėti lietuviškai, bet kol dar galutinai neišmoko, tol gebėjimų dar nedemonstruosime (šypsosi).

O ateityje jis šnekėdamas lietuviškai ir suprasdamas, ką šneka vaikas, užduodamus klausimus ir duodamas atsakymus padės mokytojui.

– Bet koks privalumas mokykloje turėti ne gyvą žmogų, bet robotą?

G.Navickas: – Visų pirma, tai yra motyvacija. Galiu pateikti vieną pavyzdį – tiesa, susijusį ne su šneka, bet su robotika. Anglijoje vienoje mokykloje buvo privaloma rytinė mankšta. Vaikai, kad to nereikėtų daryti, net vėluodavo į pamokas. Bet kai šalia mokytojo buvo pastatytas toks robotukas, visi pradėjo veržtis į tą mankštą.

Robotas yra gerai tuo, kad tinkamai jį išnaudojant, jis yra kažkas tarp žmogaus ir mašinos. Tai jau nebe tas nusibodęs žmogus, galima pritraukti dėmesį – bet tai nėra ir vien mašina. Juk pavyzdžiui, kalbėjimasis su kompiuteriu nesukuria tokio ryšio – o robotas yra tarpinis variantas, kuris sujungia abu elementus.

Tad apibendrinant – kalbant apie vaikus, tai yra mokymosi motyvatorius.

– Tad galima sakyti, kad kažkada Lietuvos mokyklose matematiką dėstys toks robotukas?

G.Navickas: – Nebūtinai matematiką. Bet kurį dalyką. Ir taip, mes propaguojame idėją, kad ateityje tai gali būti pagalbininkas mokytojui.

– Turime dar vieno žiūrovo klausimą. Valdemaras Žukovskis klausia, ar LIEPA jau moka keiktis?

A.Valotka: – LIEPAI nesvetima niekas, kas nesvetima lietuvių kalbai (šypsosi). Bet noriu pastebėti – man tiesiog nuostabus tas domėjimasis keiksmažodžiais. Nes turbūt vienintelis Lietuvos literatūros vertėjų sąjungos renginys, kuris sulaukė milžiniško žiniasklaidos susidomėjimo, buvo apie keiksmažodžių vertimo problemas (juokiasi).

Taip, LIEPA, žinoma, gali keiktis. Bet nereikia to skatinti (šypsosi).

Bet kadangi keikimasis šiek tiek susijęs su pedagogika, aš dar norėčiau sugrįžti prie tų mokytojų.

Mokytojas-robotas: toks mokytojas neemigruos. Jis yra pigesnis. Jis nesusirgs. O kitas dalykas, kodėl robotas kaip daiktas mums taip svarbu – pasaulis juda nuo mūsų technologinės aplinkos valdymo mygtukais, klaviatūra, pelėmis prie valdymo balsu. Net ne balsu, o šneka – tą reikėtų atskirti.

Ateityje šaldytuvas, dulkių siurblys, neįgaliojo vežimėlis, ligonio lova, išmanusis namas – visa tai bus valdoma šneka, komandomis, ištisiniu kalbėjimu. Dėl to darbas su šituo robotuku irgi yra to dalis. Aišku, tame yra ir žaidimo, ir smagumo – vaikai apsikabina jį, myluoja, veda parodyti senelius ir tėvelius – bet pati kryptis yra ta valdymas balsu.

Štai, prieš keletą mėnesių pas mane buvo atėjusi jūsų kolegė žurnalistė – ir pokalbiu metu kažkaip paklausiau – o kaip po pokalbio šifruosite visą įrašą? Na, ji atsakė kad klausys ir barškins klavišais. Nurodžiau tos mūsų lietuviškos firmos svetainę ir žurnalistė man jau kitą dieną paskambino – „prieš tai ėmiau interviu tris valandas, tad tris dienas būčiau šifravusi, o dabar gavau tekstą po pusvalandžio!“ Tereikėjo tik redakcinių pataisymų, atpažinimas siekė beveik 90 procentų.

Kuo tai yra gerai? Tai ne tik taupo laiką – kad ir kokiuose teismuose, ar subtitravime – bet ir iš savo aplinkos žinau, kad kai žmogus pasiekia 50-55 metų ribą, prasideda sąnarių skausmai, artritas. Žmogui, dirbančiam klaviatūra, visą laiką skauda. Jei jie gali dirbti, valdyti ir pateikti tekstą balsu – tikrai daug žmonių, dirbančių klaviatūromis, ilgiau bus darbingesni.

– Belieka paskutinis klausimas: kada mes pamatysime LIEPOS projekto finalą ir galų gale imsime su kompiuteriais bei telefonais šnekėtis lietuviškai?

A.Valotka: – Čia iš tiesų yra du skirtingi dalykai (juokiasi). LIEPA baigsis po 14 mėnesių. Kaip bus toliau – dar nieko nežinome, tai yra tas valdiško finansavimo kaifas: niekada nežinai, bus pinigų ar ne. Bet pati šių projektų ideologija yra tokia, kad mes negalime sukurti galutinio produkto. Jei sukurtume produktą rinkai, dalį pinigų iš mūsų atimtų. Mes galime nueiti tik iki daugmaž prototipo – o rinkai pateikti negalime.

Todėl, kaip Gediminas ir minėjo, mes padarome visą intelektualiausią dalį iki eksperimentinės plėtros priešpaskutinio etapo – o tada rinkai sakome: imkite nemokamai, neškitės ir darykite, tobulinkite, nudažykite supakuokite, užriškite ir parduokite. Ir mes jums linkime sėkmės!

Portalas Lrytas.lt kviečia ir drąsina visus „paaukoti“ savo balsą ir laiką šio projekto vystymui (primename, kad šiam projektui nereikia jokių išskirtinių balsų ar skaitymo gebėjimų, o būtent paprastų žmonių balsų) – tokiu būdu visi ne tik prisidėsime tiek prie vienos svarbiausių šalies ir tautos elementų – lietuvių kalbos – palaikymo šiame technologiniame amžiuje, bet ir padarysime savo pačių ateitį patogesne, kai net ir vyresniame amžiuje patogiai galėsime dirbti kompiuterinėmis sistemomis lietuviškai, valdydami jas balsu.

Nemaža portalo darbuotojų jau įrašė savo balsus, dalis dar rengiasi tai padaryti – o visus mūsų skaitytojus kviečiame parašyti laišką adresu lieposdiktoriai@gmail.com ir susiderinti dėl įrašų laiko (įrašai vyksta Vilniuje, centriniuose Vilniaus universiteto rūmuose).

Nes juk Lietuva yra graži ir verta to.

LIEPA primena, kad šiuo metu ypatingai laukiami vaikų ir vyresnio amžiaus vyrų balsai.

UAB „Lrytas“,
A. Goštauto g. 12A, LT-01108, Vilnius.

Įm. kodas: 300781534
Įregistruota LR įmonių registre, registro tvarkytojas:
Valstybės įmonė Registrų centras

lrytas.lt redakcija news@lrytas.lt
Pranešimai apie techninius nesklandumus pagalba@lrytas.lt

Atsisiųskite mobiliąją lrytas.lt programėlę

Apple App Store Google Play Store

Sekite mus:

Visos teisės saugomos. © 2024 UAB „Lrytas“. Kopijuoti, dauginti, platinti galima tik gavus raštišką UAB „Lrytas“ sutikimą.