„DeepSeek“ pateko į antraštes dėl savo pusiau atviro kodo dirbtinio intelekto modelių, kurie konkuruoja su „OpenAI“ vystomi „ChatGPT“ – nors yra sukurti už mažesnę kainą.
Pirmadienį (sausio 27 d.) „DeepSeek“ paskelbė, kad naujausias jos nemokamo „Janus“ vaizdų generatoriaus modelis „Janus-Pro-7B“ lyginamuosiuose testuose pranoko „OpenAI“ „DALL-E 3“ ir „Stability AI“ „Stable Diffusion“, pranešė „Reuters“. Tačiau skirtingų dirbtinio intelekto modelių našumą lyginanti organizacija „Artificial Analysis“ dar nėra nepriklausomai įvertinusi „DeepSeek“ „Janus-Pro-7B“.
„DeepSeek“ ir visai dirbtinio intelekto technologijų pramonei pranešimas apie vaizdų generatorių pasirodė svarbiu metu. Pirma, „DeepSeek“ nemokamas dirbtinio intelekto pokalbių robotas aplenkė „ChatGPT“ ir tapo daugiausiai parsisiunčiama nemokama programėle JAV „Apple App Store“ parduotuvėje. Vėliau tą pačią dieną bendrovė paskelbė, kad dėl plataus masto kibernetinės atakos riboja naudotojų registraciją – nors esami naudotojai ir toliau gali prisijungti, pranešė CNBC.
Akcijų rinka pirmadienį taip pat sureagavo į „DeepSeek“. Pirmaujanti dirbtinio intelekto lustų gamintoja „Nvidia“ prarado 589 mlrd. dolerių akcijų rinkos vertės – tai didžiausias vienos dienos rinkos nuostolis JAV istorijoje (nors bendrovė vis dar verta trilijonų dolerių).
Bendrovės „DeepSeek“ dirbtinio intelekto modeliai intriguoja technologijų pramonę, nes jie naudoja mažiau skaičiavimo galios nei įprasti algoritmai, todėl juos vykdyti yra pigiau. JAV riboja geriausių dirbtinio intelekto skaičiavimo lustų, kuriuos gali importuoti Kinija, skaičių, todėl „DeepSeek“ komanda sukūrė išmanesnius, efektyviau energiją naudojančius algoritmus, kurie nėra tokie imlūs energijai kaip konkurentai.
„Janus-Pro-7B“ yra nemokamas modelis, kuriuo galima analizuoti ir kurti naujus vaizdus. Kaip ir kituose vaizdų generatoriuose, vartotojai tekstu aprašo, kokio vaizdo nori, ir vaizdų generatorius jį sukuria. Remiantis technine ataskaita, kurią matė „Reuters“, modelis patobulintas dėl naujesnių mokymo procesų, geresnės duomenų kokybės ir didesnio modelio dydžio.
Kompanija „DeepSeek“ pateikė modeliui 72 milijonus aukštos kokybės sintetinių vaizdų ir suderino juos su realaus pasaulio duomenimis – todėl, kaip pranešama, „Janus-Pro-7B“ gali sukurti vizualiai patrauklesnius ir stabilesnius vaizdus nei konkuruojantys vaizdų generatoriai.
„DeepSeek“ naudoja „atviro svorio“ modelius – o tai reiškia, kad vartotojai gali peržiūrėti ir keisti algoritmus, nors neturi prieigos prie mokymo duomenų, rašo „Live Science“.
