Google представи Gemini 3.5 Live Translate: AI вече превежда разговори на 70 езика в реално време

Новият модел запазва интонацията на събеседника и работи със закъснение само от няколко секунди.

Google обяви старта на Gemini 3.5 Live Translate – нов AI аудио модел за гласов превод в реално време. Системата автоматично разпознава над 70 езика и превежда речта практически без забавяне, запазвайки интонацията, темпото и височината на гласа на говорещия.

Разработчиците наричат този нов продукт значителна стъпка в развитието на технологиите за машинен превод. Докато традиционните системи обикновено чакат фразата или изречението да бъдат завършени, преди да преведат, Gemini 3.5 Live Translate работи непрекъснато, генерирайки преведения глас паралелно с речта на говорещия.

Според Google, моделът поддържа над 2000 езикови комбинации и е способен да работи дори в шумна среда. Той също така автоматично разпознава езика на хората, с които говорите, елиминирайки необходимостта от ръчна конфигурация.

Един от ключовите случаи на употреба ще бъдат международните видео разговори и срещи. В Google Meet новата система значително ще разшири възможностите на функцията за превод на реч. Докато услугата преди поддържаше само пет езика и работеше предимно на английски, потребителите вече ще могат да общуват на десетки езици, без да е необходимо да използват един-единствен основен език.

Затвореното тестване на подобрения гласов превод в Google Meet ще започне в края на юни за избрани бизнес клиенти на Workspace. Разработчиците вече са получили достъп до Gemini 3.5 Live Translate чрез Gemini Live API и Google AI Studio. Планира се достъпът до тази функция да бъде разширен за повече потребители през годината.

Технологията вече се тества от външни партньори. Grab, по-специално, използва модела за многоезична комуникация между шофьори и пътници по време на пътувания. Според компанията услугата обработва над 10 милиона гласови повиквания месечно.

Новият превод се появи и в приложението Google Translate. Потребителите могат да включат слушалки и да получават симултанен превод на разговора. За Android е пуснат и режим на слушане, който ви позволява да слушате превода без слушалки, като държите смартфона си до ухото си, точно както по време на телефонен разговор.

Google също така отбеляза, че цялото генерирано от Gemini 3.5 Live Translate аудио съдържание е маркирано с дигитален воден знак, наречен SynthID. Този воден знак е невидим за слушателя, но позволява идентифицирането на генерираното от изкуствен интелект съдържание, което би трябвало да помогне в борбата с дезинформацията и фалшивото аудио.

Google преди това тихомълком пусна приложение за преобразуване на реч в текст, наречено Google AI Edge Eloquent, което работи офлайн. Приложението, което използва модели за автоматично разпознаване на реч Gemma, вече е достъпно за безплатно изтегляне за iOS.

Коментирайте статията в нашите Форуми. За да научите първи най-важното, харесайте страницата ни във Facebook, и ни последвайте в Google Новини, TikTok, Telegram и Viber или изтеглете приложението на Kaldata.com за Android, iPhone, Huawei, Google Chrome, Microsoft Edge и Opera!

Google представи Gemini 3.5 Live Translate: AI вече превежда разговори на 70 езика в реално време

Най-четени

Netflix променя курса: българските субтитри вече се завръщат при новите филми и сериали

Учени посочиха фундаментален проблем в разбирането за реалността

Каква е разликата между обикновения дизел и дизел плюс?

Нови ревюта

Huawei Watch Fit 5 Pro: часовникът, който тежи едва 30 грама, но прави изненадващо много

Xiaomi 17T: Телефонът, който намери точния баланс между цена и възможности

Lenovo Yoga Slim 7 Aura Edition: лаптопът под килограм, който може да ви накара да забравите за MacBook Air

Saros доказва, че Housemarque вече са сред най-добрите студиа в света

Подобни новини

Европейските алтернативи на търсачката на Google

Премахната е ексклузивна функция за Pixel: Google внезапно спря популярно приложение

Изпреварващ график: Ето кога вашите Pixel устройства ще получат новия Android 17

Google скри това в Gemini: 7 полезни функции на чатбота, които спестяват часове работа всеки ден

Връзка с нас

Приложения

Следвайте ни

Абонирайте се!

	Този коментар е спам
	Този коментар е обиден
	Друго

Google представи Gemini 3.5 Live Translate: AI вече превежда разговори на 70 езика в реално време

Най-четени

Всичко важно от света на технологиите, директно в пощата ти.

Нови ревюта

Подобни новини

Връзка с нас

Приложения

Следвайте ни

Абонирайте се!