Google представи Gemini 3.5 Live Translate: AI вече превежда разговори на 70 езика в реално време

Най-четени

Светослав Димитров
Светослав Димитровhttps://www.kaldata.com/
Занимава се със създаване на съдържание за уеб от 2009 г. с над 15000 написани новини за Калдата. Интересува се от SMM, Афилиейт и др.

Новият модел запазва интонацията на събеседника и работи със закъснение само от няколко секунди.

Google обяви старта на Gemini 3.5 Live Translate – нов AI аудио модел за гласов превод в реално време. Системата автоматично разпознава над 70 езика и превежда речта практически без забавяне, запазвайки интонацията, темпото и височината на гласа на говорещия.

Разработчиците наричат ​​този нов продукт значителна стъпка в развитието на технологиите за машинен превод. Докато традиционните системи обикновено чакат фразата или изречението да бъдат завършени, преди да преведат, Gemini 3.5 Live Translate работи непрекъснато, генерирайки преведения глас паралелно с речта на говорещия.

Според Google, моделът поддържа над 2000 езикови комбинации и е способен да работи дори в шумна среда. Той също така автоматично разпознава езика на хората, с които говорите, елиминирайки необходимостта от ръчна конфигурация.

Един от ключовите случаи на употреба ще бъдат международните видео разговори и срещи. В Google Meet новата система значително ще разшири възможностите на функцията за превод на реч. Докато услугата преди поддържаше само пет езика и работеше предимно на английски, потребителите вече ще могат да общуват на десетки езици, без да е необходимо да използват един-единствен основен език.

Затвореното тестване на подобрения гласов превод в Google Meet ще започне в края на юни за избрани бизнес клиенти на Workspace. Разработчиците вече са получили достъп до Gemini 3.5 Live Translate чрез Gemini Live API и Google AI Studio. Планира се достъпът до тази функция да бъде разширен за повече потребители през годината.

Технологията вече се тества от външни партньори. Grab, по-специално, използва модела за многоезична комуникация между шофьори и пътници по време на пътувания. Според компанията услугата обработва над 10 милиона гласови повиквания месечно.

Новият превод се появи и в приложението Google Translate. Потребителите могат да включат слушалки и да получават симултанен превод на разговора. За Android е пуснат и режим на слушане, който ви позволява да слушате превода без слушалки, като държите смартфона си до ухото си, точно както по време на телефонен разговор.

Google също така отбеляза, че цялото генерирано от Gemini 3.5 Live Translate аудио съдържание е маркирано с дигитален воден знак, наречен SynthID. Този воден знак е невидим за слушателя, но позволява идентифицирането на генерираното от изкуствен интелект съдържание, което би трябвало да помогне в борбата с дезинформацията и фалшивото аудио.

Google преди това тихомълком пусна приложение за преобразуване на реч в текст, наречено Google AI Edge Eloquent, което работи офлайн. Приложението, което използва модели за автоматично разпознаване на реч Gemma, вече е достъпно за безплатно изтегляне за iOS.

Всичко важно от света на технологиите, директно в пощата ти.

С абонирането приемате нашите Условия и Политика за поверителност. Може да се отпишете с един клик по всяко време.


Коментирайте статията в нашите Форуми. За да научите първи най-важното, харесайте страницата ни във Facebook, и ни последвайте в Google Новини, TikTok, Telegram и Viber или изтеглете приложението на Kaldata.com за Android, iPhone, Huawei, Google Chrome, Microsoft Edge и Opera!

Абонирай се
Извести ме за
guest

0 Коментара
стари
нови оценка

Нови ревюта

Подобни новини