DI sistemų pažanga jau seniai buvo vertinama pasitelkiant žaidimus – pavyzdžiui, „Google DeepMind“ meistriškumą demonstruoja virtualiuose šachmatuose ir „Go“, tačiau šiuose žaidimuose yra akivaizdūs būdai laimėti arba pralaimėti, todėl išmokyti AI sėkmingai juos žaisti yra gana paprasta.
Atviro pasaulio žaidimus su abstraktesniais tikslais ir pašaline informacija, kurią galima ignoruoti, (pavyzdžiui „Minecraft“) dirbtinio intelekto sistemoms įveikti sunkiau. Kadangi dėl daugybės pasirinkimų šie žaidimai yra šiek tiek panašesni į įprastą gyvenimą, manoma, kad jie yra svarbus etapas mokant dirbtinio intelekto agentus, kurie galėtų atlikti darbus realiame pasaulyje – pavyzdžiui, valdyti robotus ir bendrąjį DI.
Dabar „Google DeepMind“ tyrėjai sukūrė dirbtinį intelektą, kurį pavadino „Scalable Instructable Multiworld Agent“ (SIMA), kuris gali žaisti devynis skirtingus vaizdo žaidimus ir klajoti po virtualias aplinkas, kurių anksčiau nėra matęs, naudodamasis tik žaidimo vaizdu. Tai apima kosmoso tyrinėjimo žaidimą „No Man's Sky“, problemas sprendžiantį „Teardown“ ir veiksmo kupiną „Goat Simulator 3“.
„Iš tikrųjų tai yra sąsaja, kurią žmonės naudoja bendraudami su kompiuteriu, tai labai bendra sąsaja“, – sako Fredericas Besse iš „DeepMind“.
Kai SIMA gauna užduotį natūralia kalba, jis gali atlikti apie 600 užduočių, trunkančių ne ilgiau kaip 10 sekundžių, ir kurios yra bendros įvairiems žaidimams – pavyzdžiui, judėti, naudotis objektais ir naršyti po meniu. DI taip pat gali atlikti unikalesnes užduotis – pavyzdžiui, skraidyti erdvėlaiviais arba rinkti išteklius.
F. Besse ir jo kolegos panaudojo jau egzistuojančius vaizdo ir vaizdų atpažinimo modelius žaidimų vaizdo duomenų interpretavimui, tada išmokė SIMA suskirstyti tai, kas vyksta vaizdo įraše, į tam tikras užduotis. Kad gautų šią informaciją, tyrėjai privertė žmonių poras kartu žaisti vaizdo žaidimus, ir vienas asmuo stebėjo ekraną ir nurodinėjo kitam, kokius judesius atlikti, taip pat privertė žmones peržiūrėti savo žaidimo eigą ir aprašyti pelės bei klaviatūros judesius, kuriuos jie atliko atlikdami žaidimo veiksmus. Tai leido SIMA sužinoti, kaip žmonių aprašyti judesiai susiję su pačiomis užduotimis.
Kai SIMA buvo apmokytas žaisti aštuonis žaidimus, tyrėjai nusprendė, kad DI gali žaisti ir devintąjį žaidimą, kurio anksčiau nebuvo matęs. Tačiau DI nepasiekė žmogaus lygio rezultatų. Tyrėjai taikė mokymo metodą, pagal kurį aštuonis žaidimus, kuriais jie mokė dirbtinį intelektą, jie keitė, todėl devintasis žaidimas buvo testas, kuris turėjo užtikrinti, jog jis gali žaisti bet kurį iš anksčiau nematytų žaidimų.
Pasak Aberdyno universiteto (JK) atstovo Felipe Meneguzzi, ekstrapoliacija skirtinguose žaidimuose yra svarbus žingsnis link universalaus dirbtinio intelekto agento, tačiau šiuo metu SIMA gali atlikti tik gana ribotą trumpalaikių užduočių, kurioms nereikia ilgalaikio planavimo, rinkinį. Jis sako, kad DI atlikti daug platesnį sudėtingų užduočių spektrą būtų sunkiau.
„Verta prisiminti, kad tokioms bendrovėms kaip „DeepMind“ šie tyrimai iš tikrųjų susiję ne su žaidimais, o su robotika, – sako Londono karališkojo koledžo atstovas Michaelas Cookas. – Naršymas 3D aplinkoje yra priemonė tikslui pasiekti, o šios bendrovės nori sukurti dirbtinio intelekto sistemas, galinčias suvokti aplinkinį pasaulį ir jame veikti. Taigi, nemanau, kad tai turės didelės įtakos vaizdo žaidimams – tačiau tai gali turėti daug nežinomų pasekmių mūsų gyvenimui išorėje, realiame pasaulyje.“