Изкуственият интелект може да говори с всякакъв глас

0
587

Китайският медиен гигант Baidu анонсира пускането на невронна мрежа, която по-добре от всички други аналози може да имитира човешкия глас. Тя изследва оригиналното звучене на гласа и напълно го копира, като ако е необходимо добавя и съответния акцент и нюанс. Главната особеност на алгоритъма е много бързия анализ на акустичните данни.

През 2017 г. бе представена миналата версия на тази иновация – Baidu Deep Voice, който за генерирането на нов глас му бяха необходими повече от 30 минути за анализирането на оригинала. На инструмента Adobe VoCo са му нужни 20 минути, канадският Lyrebird прави това за минута, а новата технология на Baidu, която все още няма име, се вписва в няколко секунди.

Тази разработка има големи търговски възможности — например, може да бъде гласов асистент, чийто глас да е на любим актьор или персонаж. Електронна бавачка, която ще говори на детето с гласа на майка му и ще го успокоява. Възможност за общуване с човек, който временно е загубил способността си да говори. Запис на аудиокниги и гласови действия, без включването на притежателя на избрания глас и много други.

Абонирай се
Извести ме за
guest
0 Коментара
Отзиви
Всички коментари