Kuria „biologijos ChatGPT“ – tačiau yra abejojančių to naudingumu

2025 m. liepos 1 d. 08:31
Lrytas.lt
Didžiosios Britanijos biotechnologijų įmonė „Basecamp Research“ pastaruosius kelerius metus rinko daugybę genetinių duomenų apie ekstremaliose aplinkose visame pasaulyje gyvenančius mikrobus ir nustatė daugiau nei milijoną rūšių – ir beveik 10 milijardų naujų genų. Įmonė teigia, kad ši didžiulė planetos biologinės įvairovės duomenų bazė padės parengti „biologijos ChatGPT“, kuris atsakys į klausimus apie gyvybę Žemėje – tačiau nėra jokių garantijų, kad tai pavyks, rašo „New Scientist“.
Daugiau nuotraukų (1)
Leibnico instituto (Vokietija), kuriame saugoma viena iš įvairiausių pasaulyje mikrobų kultūrų kolekcijų, darbuotojas Jörgas Overmannas teigia, kad didėjantis žinomų genetinių sekų skaičius yra vertingas, tačiau neturint daugiau informacijos apie organizmus, iš kurių jos buvo surinktos, vaistų atradimo ar chemijos srityse gali būti nenaudingas. „Nesu įsitikinęs, kad galiausiai tikrai naujų funkcijų supratimą pagreitins šis brutalus sekų erdvės didinimas“, – sako jis.
Pastaraisiais metais mokslininkai sukūrė daugybę mašininio mokymosi modelių, apmokytų identifikuoti dėsningumus ir numatyti ryšius tarp didžiulių biologinių duomenų kiekių. Garsiausias iš jų yra „AlphaFold“, kuris gali nuspėti baltymo 3D struktūrą remdamasis tik genetiniais duomenimis ir kurio kūrėjams iš „Google DeepMind“ 2024 m. buvo skirta Nobelio premija chemijos srityje.
Nors nuo to laiko tokie „generatyvinės biologijos“ modeliai tapo vis sudėtingesni, jie netapo daug geresni, sako Frances Ding iš Kalifornijos universiteto Berklyje. Viena iš priežasčių gali būti biologinės įvairovės duomenų trūkumas. „Dabartiniai biologijos modeliai yra apmokyti naudojant duomenų rinkinius, kuriuose neproporcingai daug gerai ištirtų rūšių (pvz., E. coli, pelių, žmonių), ir šie modeliai blogiau prognozuoja kitų gyvybės medžio dalių savybes“, – sako ji.
„Basecamp“ tyrėjai ėmėsi spręsti šią biologinės įvairovės spragą. Įmonės skelbiamoje ataskaitoje teigiama, kad šiuo metu didėjančioje duomenų bazėje yra mėginių iš daugiau nei 120 vietų 26 šalyse. Bendrovės vyriausiasis mokslo darbuotojas Jonathanas Finnas sako, kad daugiausia dėmesio buvo skiriama ekstremalioms aplinkoms, kurių mėginiai dar nebuvo plačiai tiriami – nuo šalto vandens po Arkties ledu iki džiunglių karštųjų šaltinių. „Dauguma mėginių, kuriuos rinkome, yra prokariotiniai mėginiai: bakterijos, mikrobai ir jų virusai, – sako J. Finnas. – Žinau, kad turime ir grybų“.
Atlikus šių mėginių genetinę analizę paaiškėjo genų, kurie beveik visuotinai paplitę visame gyvybės medyje, skirtumai – remdamasi tuo, bendrovė apskaičiavo, kad šiuose duomenyse yra informacijos apie daugiau kaip 1 mln. rūšių, kurių nėra viešuose genomo duomenų rinkiniuose, naudojamuose dirbtinio intelekto biologijos modeliams mokyti. Tyrėjai teigia, kad juose bendrai yra apie 9,8 mlrd. naujai identifikuotų genų, t. y. 10 kartų daugiau žinomų genų, kurių kiekvienas koduoja potencialiai naudingą baltymą.
„Parodžius šiems modeliams didelę gamtos dalį, jie turėtų geriau suprasti, kaip veikia biologija, – sako mokslininkas. – Mes bandome sukurti biologijos „ChatGPT.“
Kai kuriais skaičiavimais, Žemėje gyvena net trilijonas mikrobų rūšių, iš kurių beveik nė viena nėra gerai apibūdinta. Todėl nenuostabu, kad bendrovė identifikavo tiek daug naujos gyvybės. „Beveik neišvengiama, kad jei ištirsite daugiau, gausite daugiau skirtingų genų variantų“, – sako Leopoldas Partsas iš Wellcome Sangerio instituto (Jungtinė Karalystė).
Tačiau „Basecamp“ tikisi, kad visa nauja medžiaga gali būti vertinga – ir jie ne vieninteliai. „Tai vienas įdomiausių dalykų, kuriuos esu matęs per ilgą laiką“, – sako JAV biotechnologijų bendrovės „Genentech“ mašininio mokymosi tyrėjas Nathanas Frey. Jis sako, kad dirbtinio intelekto modelių kūrimas biologijos srityje buvo sutelktas į algoritmų tobulinimą arba daugiau duomenų generavimą laboratorijose, o ne į išvykimą į pasaulį ir mėginių rinkimą.
Tačiau yra priežasčių skeptiškai vertinti, kad duomenų bazė padės sukurti iš esmės patobulintus modelius, kurių nori bendrovė. Pirma, vis dar neaišku, kiek ši nauja baltymų įvairovė atspindi naujas vertingas funkcijas – pavyzdžiui, plastiką ardančių fermentų ar baltymų, kuriuos būtų galima pritaikyti genų redagavimui. „Jie turi įrodyti, kad ši naujovė yra kaip nors naudinga“, – sako L. Partsas.
Be to, jei nauji genai iš tiesų iš esmės skiriasi nuo jau žinomų, J. Overmanas nemato, kaip esamos priemonės galėtų lengvai nuspėti jų funkcijas arba kaip duomenis būtų galima panaudoti naujam modeliui apmokyti. „Neturite jokio supratimo, ką daro dauguma genų“, – sako jis.
Gali būti, kad bendrovė surinko naujos biologijos lobį, tačiau be daugiau senamadiško laboratorinio darbo, kad suprastų, kas jame yra, jis gali likti paslaptimi net ir galingiausiam dirbtiniam intelektui, rašo „New Scientist“.
biologijadirbtinis intelektasgenai
Rodyti daugiau žymių

UAB „Lrytas“,
A. Goštauto g. 12A, LT-01108, Vilnius.

Įm. kodas: 300781534
Įregistruota LR įmonių registre, registro tvarkytojas:
Valstybės įmonė Registrų centras

lrytas.lt redakcija news@lrytas.lt
Pranešimai apie techninius nesklandumus pagalba@lrytas.lt

Atsisiųskite mobiliąją lrytas.lt programėlę

Apple App StoreGoogle Play Store

Sekite mus:

Visos teisės saugomos. © 2026 UAB „Lrytas“. Kopijuoti, dauginti, platinti galima tik gavus raštišką UAB „Lrytas“ sutikimą.