A kép forrása: Blikk
A Microsoft VALL-E 2 képes meggyőzően reprodukálni az emberi hangokat mindössze néhány másodpercnyi hanganyag felhasználásával – állítják az alkotói. A Microsoft által kifejlesztett új, mesterséges intelligencián alapuló beszédgenerátor annyira meggyőző, hogy nem adható ki a nyilvánosságnak.
A Microsoft kutatói szerint a VALL-E 2 egy mesterséges intelligencia hanggenerátor, amely képes pontos és természetes beszéd létrehozására. A generátor által létrehozott beszéd megfelel vagy meghaladja az emberi beszéd minőségét a benchmarkokban. A VALL-E 2 képességeit az Ismétléstudatos mintavételezés és a csoportosított kódmodellezés teszi lehetővé, amelyek javítják a beszédminőséget és a hatékonyságot. A kutatók hangmintákat használtak a generátor teljesítményének felmérésére, és megállapították, hogy eléri az emberi paritást. A Microsoft nem hozza nyilvánosságra a VALL-E 2-t a visszaélési kockázatok miatt, azonban az AI beszédtechnológia jövőbeli alkalmazásaira vonatkozóan nagy potenciált látnak.