Kaip dirbtinis intelektas pradės kalbėti už mus

Su šeima žiūrėjome animacinį filmą „Wall-E“, kur žmonės ateityje yra vaizduojami kaip nepaeinantys tinginiai – robotai juos vežioja lovose, aprengia, maitina, paduoda telefonus. Vienintelis darbas, kurį jie dar atlieka – tai išmaniaisiais įrenginiais bendrauja su kitais žmonėmis. Tačiau aš drįsčiau tokiai idėjai paprieštarauti.

Uždaras sistemas su griežtomis taisyklėmis besimokantys algoritmai gali perprasti, tačiau atviros sistemos (pvz. pokalbis su gyvu žmogumi), kaip teigė legendinis šachmatininkas Garris Kasparovas, yra per daug plačios. <br>123RF nuotr. 
Uždaras sistemas su griežtomis taisyklėmis besimokantys algoritmai gali perprasti, tačiau atviros sistemos (pvz. pokalbis su gyvu žmogumi), kaip teigė legendinis šachmatininkas Garris Kasparovas, yra per daug plačios. <br>123RF nuotr. 
Paveikslėliuose žmogaus duotas tekstas yra paryškintas, o modelio sugeneruotas – neparyškintas. <br>L.Stankevičiaus iliustr. 
Paveikslėliuose žmogaus duotas tekstas yra paryškintas, o modelio sugeneruotas – neparyškintas. <br>L.Stankevičiaus iliustr. 
Daugiau nuotraukų (2)

Lukas Stankevičius

Dec 21, 2019, 4:36 PM, atnaujinta Dec 21, 2019, 6:06 PM

Šis straipsnis yra mokslo populiarinimo konkurso darbas, daugiau informacijos apie šį konkursą rasite čia.

Žvelgdamas vien į šių metų dirbtinio intelekto pasiekimus kalbos srityje, galiu teigti, kad mums nereikės net ir kalbėti. Norėdami rasti vietą vakarienei su mylimuoju, duosime sistemai maždaug tokią komandą: „Sistema X, užsakyk staliuką dviems gerame restorane, kur nors netoliese“. O kitais atvejais: „Noriu išsiskirti su X, pašnekėk su juo/ja“. Skamba baisiai, tiesa? Bet ką tokiu atveju turėtume veikti mes – arba kas bus likę mums veikti? Šį klausimą geriau palikti filosofams.

Ne veltui minėjau staliuko užsakymą – tai jau įmanoma. Dar 2018 m. gegužę „Google“ pristatė savo asistentą „Google Duplex“, kuris, kaip teigiama, ir yra skirtas tokiems užsakymams. Per pristatymą buvo parodyta, kad asistentas daug geriau susigaudė apie ką kalbama, nei telefonu atsiliepusi restorano darbuotoja – o tai daug kam auditorijoje sukėlė juoką. Tokia situacija mums juokinga, nes asistentui tai buvo sunki situacija dėl žmogaus nesupratingumo – bet jis problemą įveikė.

„Google Duplex“ nėra vienintelis toks asistentas: kitas gerai žinomas yra „Amazon Alexa“. Tai – garso kolonėlės pavidalo įrenginys, valdomas balsu. Alexa'os paprašius, ši gali paleisti norimą muziką, nustatyti žadintuvą, paaiškinti terminą, pasakyti orų prognozę, pranešti naujausias žinias ir t.t. Beveik kiekviena didžioji kompanija yra sukūrusi kokį nors asistentą. „Samsung“ turi „Bixby“, „Apple – Siri“, o „Microsoft“ – „Cortana“.

Kiekvienas norėtume asistento, kuris kalbėtų už mus – bet ne prieš mus. Deja, pasaulyje jau vyksta „prieš“. Garsi JAV laida „Last week tonight“, 2019 m. kovą sukūrė laidą, skirtą būtent robotų skambučiams. Tai nėra paprasti balso įrašai, kuriuos esame įpratę girdėti paskambinę paslaugų numeriu – vietoje to skambučių metu robotai reaguoja (ir dar labai įtikinamu balsu) į tai, ką mes pasakome. Atskirti, kad skambina robotas (kompiuteris) galima, tačiau tai užtrunka (reikia gerai pagalvoti, ko paklausti). Na, o dėl to tenka arba aukoti savo laiką, arba neatsakinėti į skambučius iš nežinomų numerių. 

Išsigando, nes per geras

Mokslo pasaulyje garsiai nuskambėjo ir GPT-2 modelio nepaviešinimo atvejis. „OpenAI“ organizacija sukūrė kalbos modelį, bet nusprendė jo neišleisti (nors pačios organizacijos pavadinimas sako ką kita). Priežastis – GPT-2 modelis pasirodė „per geras“. Teigta, kad žmonės jo sugeneruoto teksto neatskirs nuo to, kurį parašė realūs žmonės. Buvo baiminamasi, kad su šiuo modeliu melagingų naujienų kūrimas gali spačiai padidėti. Nepaisant šių baimių, pasirodė dar „baisesnių“ modelių, o GPT-2 dabar yra jau laisvai prieinamas.

GPT-2 tikrai nėra žaisliukas, jis remiasi 2017 m. sukurta „Transformerio“ architektūra ir turi net 1,5 mlrd. parametrų. Modelis apmokytas iš 8 milijonų kokybiškų žiniatinklio puslapių. Pats apmokymas truko virš 2000 TPU (angl. Tensor Processing Unit, vaizdo plokštės GPU „giminaitis“) dienų. Apmokyti tokio lygio modelį iš viso gali kainuoti virš 60 000 dolerių, o kur dar išlaidos testavimams ir kitiems dalykams.

Šį modelį galima išbandyti internete (keli pavyzdžiai pateikti žemiau paveikslėliuose). Tereikia suvesti savo pradinį tekstą (anglų kalba) ir nurodyti, kad toliau tekstą generuotų GPT-2. Patys įvertinkite, kaip tekstą generuoja modeliai. Pamatysite, kad nors ir dažnai sugeneruoja rišlų sakinį, kartais iš didelio rašto išeina iš krašto. Siūlau perskaityti ir vieną geriausių generavimo atvejų apie vienaragius, pateiktą čia.

Paveikslėliuose žmogaus duotas tekstas yra paryškintas, o modelio sugeneruotas – neparyškintas.

Kai kur šie modeliai jau dabar yra labai gerai pritaikyti užduotims. Pavyzdžiui, teksto suvokimo užduočių tekstynas RACE, sukurtas aukštosios mokyklos studentų stojamiesiems egzaminams. Čia pateikiami tokie klausimai, kaip „koks geriausias šios ištraukos apibūdinimas?“, „koks buvo autoriaus požiūris į …“, „kurie teiginiai yra neteisingi?“, „jei ištrauka atsidurtų laikraštyje, kuri pastraipa būtų tinkamiausia?“, „pirmas pašto ženklas buvo pagamintas...“ ir t.t.

Šio tekstyno klausimai buvo specialiai sukurti kinų studentams, stojantiems į aukštąsias mokyklas – o ar jūs sugebėtumėte į juos atsakyti? Geriausi kalbos algoritmai atsako 89,4 proc. klausimų teisingai, bet RACE yra bene vienintelis tekstynas, kuriame žmonės dar pirmauja. Kitose užduotyse kompiuteriniai algoritmai paprastus žmones jau seniai yra aplenkę.

Žinoma, kyla klausimas kodėl modeliams dar nepavyksta pilnai įtikinti žmonių savo pasakomis – bet kai kuriose užduotyse jie mus vis tiek aplenkia? Uždaras sistemas su griežtomis taisyklėmis besimokantys algoritmai gali perprasti, tačiau atviros sistemos (pvz. pokalbis su gyvu žmogumi), kaip teigė legendinis šachmatininkas Garry Kasparovas, yra per daug plačios. Vis dėlto, niekas nežino, kaip gali pasisukti kalbos modelių tyrimai. Greitis, kuriuo vystosi ši sritis, yra tiesiog įspūdingas. Žemiau pateikiu kada ir kokie kalbos modeliai atsirado – galite patys pamatyti kokios lenktynės vyksta:

  • 2018 spalio 11: BERT;
  • 2019 vasario 14: GPT-2;
  • 2019 birželio 19: XLNET;
  • 2019 liepos 26: RoBERTa;
  • 2019 rugsėjo 26: ALBERT;
  • 2019 spalio 23: T5.

Turbūt jau supratote, kad kol kas dirbtinis intelektas mokosi tik anglų kalbos. Iš įdomesnių lietuvių projektų galima paminėti nebent „dirbtinį idiotą“,  anoniminį komentatorių „Artūrka“, kurio svetainė jau nebeveikia.

Mašininio mokymosi mokslo padėtis Lietuvoje yra prilygintina „pralaimėtam pirmajam kėliniui“. Tačiau nenusiminkime, nes iš tiesų tik laiko klausimas, kada turėsime lietuvių kalba valdomą asistentą, generuosime lietuvišką tekstą, o mus vargins lietuviškų robotų skambučiai. Jei tik pakankamai įsisavinsime anglų kalboje esančias technologijas, gal net jau ir kitas šio teksto autoriaus darbas būtų, na taip sakant, ne visai šio autoriaus.

UAB „Lrytas“,
A. Goštauto g. 12A, LT-01108, Vilnius.

Įm. kodas: 300781534
Įregistruota LR įmonių registre, registro tvarkytojas:
Valstybės įmonė Registrų centras

lrytas.lt redakcija news@lrytas.lt
Pranešimai apie techninius nesklandumus pagalba@lrytas.lt

Atsisiųskite mobiliąją lrytas.lt programėlę

Apple App Store Google Play Store

Sekite mus:

Visos teisės saugomos. © 2024 UAB „Lrytas“. Kopijuoti, dauginti, platinti galima tik gavus raštišką UAB „Lrytas“ sutikimą.