Tiago da Silva Barros iš Prancūzijos Kot d'Azur universiteto ir jo kolegos išnagrinėjo 14 skirtingų užduočių, kurioms žmonės naudoja generatyvinius DI įrankius, pradedant teksto generavimu ir baigiant kalbos atpažinimu bei vaizdų klasifikavimu.
Tada jie išnagrinėjo viešas reitingų lenteles, įskaitant tas, kurias tvarko mašininio mokymosi centras „Hugging Face“, siekdami įvertinti skirtingų modelių veikimą. Modelio energijos vartojimo efektyvumas išvados metu – kai DI modelis pateikia atsakymą – buvo matuojamas naudojant įrankį „CarbonTracker“, o bendras to modelio energijos suvartojimas buvo apskaičiuotas stebint vartotojų atsisiuntimus.
„Remiantis modelio dydžiu, mes įvertinome energijos suvartojimą ir, remdamiesi tuo, galime bandyti atlikti savo skaičiavimus“, – sako T. da Silva Barros.
Tyrėjai nustatė, kad visose 14 užduotyse perėjimas nuo geriausiai veikiančių modelių prie energijos vartojimo požiūriu efektyviausių modelių kiekvienai užduočiai sumažino energijos suvartojimą 65,8 proc.
Kadangi kai kurie žmonės jau naudoja ekonomiškiausius modelius, jei realiame pasaulyje žmonės pereitų nuo aukštos klasės modelių prie ekonomiškiausių modelių, jie galėtų sumažinti bendrą energijos suvartojimą 27,8 proc. „Buvome nustebinti, kiek galima sutaupyti“, – sako komandos narys Frédéric Giroire iš Prancūzijos nacionalinio mokslinių tyrimų centro.
Tačiau tam reikėtų pokyčių tiek iš vartotojų, tiek iš DI įmonių pusės, sako T. da Silva Barros. „Turime mąstyti apie mažų modelių naudojimą, net jei dėl to prarastume dalį našumo, – sako jis. – O įmonėms, kuriančioms modelius, svarbu dalytis informacija apie modelį, kad vartotojai galėtų suprasti ir įvertinti, ar modelis sunaudoja daug energijos, ar ne.“
Kai kurios DI bendrovės mažina savo produktų energijos suvartojimą taikydamos procesą, vadinamą modelių distiliavimu, kai dideli modeliai naudojami mažesnių modelių mokymui. Tai jau daro didelį poveikį, sako Chrisas Preistas iš Bristolio universiteto Jungtinėje Karalystėje. Pavyzdžiui, „Google“ neseniai paskelbė, kad per pastaruosius metus „Gemini“ energijos vartojimo efektyvumas pagerėjo 33 kartus.
Tačiau pasak Ch. Preisto, vartotojų privertimas rinktis efektyviausius modelius „vargu ar padės apriboti energijos suvartojimo augimą duomenų centruose, kaip teigia autoriai, bent jau dabartinėje DI burbulo situacijoje“. „Sumažinus energijos suvartojimą vienam užklausimui, tiesiog bus galima greičiau aptarnauti daugiau klientų, siūlant sudėtingesnes mąstymo galimybes“, – sako jis.
„Mažesnių modelių naudojimas tikrai gali sumažinti energijos suvartojimą trumpuoju laikotarpiu, tačiau yra daug kitų veiksnių, į kuriuos reikia atsižvelgti, darant kokias nors reikšmingas prognozes ateičiai“, – teigia Sasha Luccioni iš „Hugging Face“. Ji įspėja, kad reikia atsižvelgti į atoveiksmio efektus – pavyzdžiui, padidėjusį naudojimą, taip pat į platesnį poveikį visuomenei ir ekonomikai.
S. Luccioni atkreipia dėmesį, kad bet kokie tyrimai šioje srityje remiasi išoriniais įvertinimais ir analizėmis, nes atskirų įmonių veikla nėra pakankamai skaidri. „Norėdami atlikti tokias sudėtingesnes analizes, mums reikia didesnio DI įmonių, duomenų centrų operatorių ir netgi vyriausybių skaidrumo, – sako ji. – Tai leistų tyrėjams ir politikams priimti pagrįstus sprendimus ir prognozes.“
Tyrimas publikuotas „arXiv“.
Parengta pagal „New Scientist“.
