fbpx
4.8 C
София

WaveNet: изкуствен интелект, генериращ реалистична човешка реч

Най-четени

Даниел Десподовhttps://www.kaldata.com/
Ежедневен автор на новини. Увличам се от съвременни технологии, оръжие, информационна безопасност, спорт, наука и концепцията Internet of Things.

DeepMind е самостоятелен отдел на Google, който работи в областта на ИИ. Именно тази компания създаде AlphaGo – системата, победила световния шампион по Го – корееца Ли  Седол.

 

DeepMind не се занимава само с логически игри. В момента специалистите на компанията работят върху компютърна система за генериране на човешка реч. Използва се слаб ИИ, който според експертите може кардинално да подобри ситуацията с изкуствено синтезираната реч.

Компютрите и сега генерират човешка реч, като най-често се използват фрагменти от речта на реален човек, които образуват по-сложни отрязъци, или се използват най-разнообразни математически модели за генериране на звукови фрази. Но нито един от тези методи не е особено добър, понеже хората веднага забелязват изкуствените гласове и проблемите с интонацията и произношението.

 

WaveNet използва достойнствата и на двата метода. В новия модел също се използват фрагменти от реални човешки гласове, от които самообучаващи се невронни мрежи формират звуковите фрази. Но на тази система може да се подаде информация за лингвистичните и фонетични правила.

 

Резултатите са впечатляващи. Изкуственият глас звучи някак си човешки. При тестовете с доброволци, 50% от хората са сметнали, че гласът на машината всъщност е човешки.

Във WaveNet вече са записани над 44 часа човешка реч, а думите, звуците и фразите са на 109 различни хора. Оказа се, че WaveNet перфектно моделира гласа на всеки участник в експеримента и дори вмъква специфичното поемане на дъх и говорните дефекти на конкретния човек.

Абонирай се
Извести ме за
guest
0 Коментара
Отзиви
Всички коментари

Нови ревюта

Подобни новини