„Microsoft“ teksto vertimo į kalbą sistema per tris sekundes gali nukopijuoti balsą ir įgarsinti tekstą

Nuo pat pirmojo teksto vertimo į kalbą (angl. text-to-speech, TTS) modelio išleidimo mokslininkai ieškojo būdų, kaip patobulinti šių sistemų kalbos generavimo būdą. Naujausias „Microsoft“ modelis „VALL-E“ šiuo požiūriu yra reikšmingas žingsnis į priekį, pasakoja futurologas Rayus Hammondas.

 Kompanija „Microsoft“ paskelbė keletą veikiančio modelio pavyzdžių – ir akivaizdu, kad tai yra didelė pažanga TTS technologijose.<br> 123rf iliustr.
 Kompanija „Microsoft“ paskelbė keletą veikiančio modelio pavyzdžių – ir akivaizdu, kad tai yra didelė pažanga TTS technologijose.<br> 123rf iliustr.
Daugiau nuotraukų (1)

Lrytas.lt

Jan 31, 2023, 2:11 PM

„VALL-E“ – tai TTS modelis, kuris gali generuoti kalbą bet kokiu balsu, „išgirdęs“ vos trijų sekundžių to balso pavyzdį. Tai didelis patobulinimas, palyginus su ankstesniais modeliais, kuriems reikėjo daug ilgesnio mokymo laikotarpio, kad būtų galima sukurti naują balsą.

Be to, generuojamoje kalboje išlieka balso intonacija, „charizma“ ir stilius. Tai svarbus žingsnis į priekį siekiant, kad TTS sistemos skambėtų natūraliau.

Kompanija „Microsoft“ paskelbė keletą veikiančio modelio pavyzdžių – ir akivaizdu, kad tai yra didelė pažanga TTS technologijose.

UAB „Lrytas“,
A. Goštauto g. 12A, LT-01108, Vilnius.

Įm. kodas: 300781534
Įregistruota LR įmonių registre, registro tvarkytojas:
Valstybės įmonė Registrų centras

lrytas.lt redakcija news@lrytas.lt
Pranešimai apie techninius nesklandumus pagalba@lrytas.lt

Atsisiųskite mobiliąją lrytas.lt programėlę

Apple App Store Google Play Store

Sekite mus:

Visos teisės saugomos. © 2024 UAB „Lrytas“. Kopijuoti, dauginti, platinti galima tik gavus raštišką UAB „Lrytas“ sutikimą.
„Nauja diena“: ar yra galimybių, kad įvyks pilietybės referendumas?