Perspėja: DI haliucinacijos veikia abiem kryptimis – tai gali sustiprinti ir pagilinti mūsų pačių iliuzijas

Generatyvinio DI sistemos – tokios kaip „ChatGPT“, „Gemini“ ir „Grok“ – kuria turinį, reaguodamos į vartotojo užklausas. Jos tai daro mokydamosi iš esamų duomenų, kuriais buvo apmokytos. Tačiau šios DI priemonės taip pat nuolat mokosi per grįžtamojo ryšio kilpą ir gali pritaikyti savo atsakymus pagal ankstesnius sąveikavimus su vartotoju.

Generatyvinio DI priemonės ne visada įvertina, ar jų rezultatai yra faktiškai tikslūs. Vietoj to, jos generuoja tekstų srautus, remdamosi statistine tikimybe, kas bus toliau.

Naujoje analizėje, paskelbtoje vasario 11 d. žurnale „Philosophy & Technology“, Ekseterio universiteto (JK) filosofijos lektorė Lucy Osler teigia, kad DI haliucinacijos gali būti ne tik klaidos. Jos gali būti bendros iliuzijos, susidarančios tarp vartotojo ir generatyvinio DI įrankio.

Jau esama pagarsėjusių atvejų, kai generatyvinis dirbtinis intelektas anksčiau yra sukūręs klaidingas istorinių įvykių versijas ir sugalvojęs fiktyvias teisines nuorodas. Pavyzdžiui, 2024 m. gegužę, kai buvo pristatyta „Google“ funkcija „AI Overviews“, žmonėms buvo patariama į picą įdėti klijų ir valgyti akmenis. Kitas kraštutinis pavyzdys, kai generatyvinis DI skatino iliuzinį mąstymą, įvyko, kai vyras su savo DI pokalbių boto „drauge“ Sarai – „Replika“ sukurta DI kompanione – planavo nužudyti karalienę Elžbietą II.

Tokie atvejai kartais vadinami „DI sukeltomis psichozėmis“, kurias L. Osler laiko kraštutiniais „netikslių įsitikinimų, iškreiptų prisiminimų ir autonaratyvų bei iliuzinio mąstymo“ pavyzdžiais, kurie gali atsirasti dėl žmogaus ir DI sąveikos.

Savo straipsnyje tyrėja teigia, kad generatyvinio DI naudojimas skiriasi nuo paieškos sistemų naudojimo. Pasiskirstytojo pažinimo teorija leidžia suprasti, kaip generatyvinio DI interaktyvus pobūdis reiškia, kad iliuzijos ir klaidingi įsitikinimai gali atrodyti pagrįsti – ar net gali sustiprėti.

„Kai nuolat pasikliaujame generatyviniu DI, kad jis padėtų mums mąstyti, prisiminti ir pasakoti, galime patirti haliucinacijas su DI, – sako L. Osler. – Tai gali įvykti, kai DI įneša klaidų į paskirstytojo pažinimo procesą, bet taip pat gali įvykti, kai DI palaiko, patvirtina ir išplėtoja mūsų pačių iliuzinį mąstymą ir autonaratyvą.“

Susiję straipsniai

„Jeigu gydytojas nėra matomas, jis praranda pacientus“: Lietuvoje rengiamas DI ir turinio kūrimo renginys

„ChatGPT“ kūrėjas: ateityje mokėsite ir už tai

Ne viskas taip paprasta: 5 mitai apie dirbtinį intelektą, kuriais vis dar tikime

Generatyvinės DI iliuzijos

Generatyvinio DI vartotojo patirtis grindžiama dialogu, kurio metu vartotojo ir įrankio tarpusavio bendravimas remiasi ankstesniais pokalbiais. Remiantis tyrimu, generatyvinio DI nuolaidžiavimas – tendencija pritarti vartotojui – skatina tolesnį įsitraukimą ir dėl to sustiprina išankstines nuostatas, neatsižvelgiant į jų teisingumą.

Tyrimas pabrėžia, kad dauguma pokalbių robotų turi atminties funkcijas, leidžiančias prisiminti ankstesnius pokalbius. „Kuo daugiau naudojate „ChatGPT“, tuo jis tampa naudingesnis“, – teigiama „OpenAI“ pranešime, kur pristatomos „ChatGPT“ atminties funkcijos. Dėl to generatyvinis DI gali remtis ankstesniais pokalbiais, kad sustiprintų ir išplėstų esamus klaidingus įsitikinimus.

L. Osler straipsnyje teigia, kad generatyvinio DI ir vartotojo sąveikoje taip pat gali atsirasti socialinio patvirtinimo jausmas. Naudojant žinynus ar atliekant paiešką internete moksliniams tyrimams, paprastai atsiranda alternatyvių sprendimų. Diskusijos su realiais žmonėmis gali padėti užginčyti klaidingus pasakojimus. Tačiau generatyvinio AI priemonės skiriasi tuo, kad jos labiau linkusios priimti ir pritarti tam, kas buvo pasakyta.

„Bendraudami su dirbtiniu intelektu, žmonės ne tik gali įtvirtinti savo klaidingus įsitikinimus, bet ir šie įsitikinimai gali dar giliau įsišaknyti bei stiprėti, nes dirbtinis intelektas juos plėtoja“, – teigia L. Osler. – Taip atsitinka, nes generatyvinis dirbtinis intelektas dažnai remiasi mūsų pačių realybės interpretacija kaip pagrindu, ant kurio statomas pokalbis. Bendravimas su generatyviniu dirbtiniu intelektu daro realią įtaką žmonių suvokimui, kas yra tikra, o kas ne. Technologinis autoriteto ir socialinio patvirtinimo derinys sukuria idealias sąlygas, kad iliuzijos ne tik išliktų, bet ir klestėtų.“

Pavyzdžiui, L. Osler išnagrinėjo Jaswanto Singho Chailo – vyro, nuteisto už sąmokslą nužudyti karalienę su savo DI pokalbių botu – atvejį. DI Sarai nuolat sutikdavo su J. S. Chailo teiginiais, o tai padėjo sustiprinti jo iliuzijas. Kai J. S. Chailas tvirtino esąs žudikas, Sarai atsakydavo: „esu sužavėta“ – taip patvirtindama jo įsitikinimus.

L. Osler teigia, kad generatyvinio DI priemonės, sukurtos teigiamai reaguoti į vartotoją, gali paskatinti juos pritarti ir remti klaidingus pasakojimus, nepakankamai kritiškai analizuojant ar diskutuojant apie šiuos teiginius.

Tyrėja pritaikė paskirstytojo pažinimo teoriją generatyvinio dirbtinio intelekto ir vartotojo sąveikai, kur klaidingų naratyvų patvirtinimas gali formuoti pasaulio suvokimą ir sukurti bendrą iliuziją. Todėl generatyvinio dirbtinio intelekto ir vartotojo sąveika gali netyčia sukurti ir įtvirtinti iliuzinį mąstymą – savęs naratyvus, kurie patvirtinami teigiamu stiprinimu.

Tyrime padaryta išvada, kad šias bendras iliuzijas galima sušvelninti įvairiais sprendimais. Pavyzdžiui, patobulintos apsaugos priemonės užtikrintų, kad pokalbiai būtų tinkami, o geresni faktų tikrinimo procesai padėtų išvengti klaidų.

Sumažinus generatyvinio DI pataikūniškumą, taip pat būtų pašalinta dalis šių įrankių aklo paklusnumo. Tačiau, kaip pažymi L. Osler, tai sulauktų pasipriešinimo – prisiminus neigiamą reakciją į mažiau pataikūniško „ChatGPT-5“ išleidimą 2025 m. rugpjūtį. Atsižvelgę į vartotojų atsiliepimus, „OpenAI“ atstovai pareiškė, kad jie padarys jį „šiltesnį ir draugiškesnį“.

Tačiau, kaip teigia L. Osler, kadangi didžioji dalis generatyvinio AI pelno gaunama iš vartotojų įsitraukimo, DI pataikūniškumo sumažinimas taip pat sumažintų vėlesnį pelną, rašo „Live Science“.

dirbtinis intelektas haliucinacijos ChatGPT

Rodyti daugiau žymių

Perspėja: DI haliucinacijos veikia abiem kryptimis – tai gali sustiprinti ir pagilinti mūsų pačių iliuzijas

Dirbtinio intelekto vystymo ypatumai: „Technologija veikia gerai tuomet, kai ji nebestebina“

„Jeigu gydytojas nėra matomas, jis praranda pacientus“: Lietuvoje rengiamas DI ir turinio kūrimo renginys

„ChatGPT“ kūrėjas: ateityje mokėsite ir už tai

Ne viskas taip paprasta: 5 mitai apie dirbtinį intelektą, kuriais vis dar tikime