fbpx
13.8 C
София

Google са създали ИИ, който може да генерира музика чрез текстово описание, но няма да го пусне публично

Най-четени

Впечатляваща нова система с изкуствен интелект на Google може да генерира музика от всякакъв жанр, чрез просто задаване на текстово описание, но компанията, опасявайки се от рисковете, не планира да я пусне на пазара.

Наречена MusicLM, системата на Google със сигурност не е първата ИИ генерираща система за песни. Правени са и други опити, включително Riffusion – ИИ, който композира музика, като я визуализира, както и Dance Diffusion, собствената AudioML на Google и Jukebox на OpenAI, но поради технически ограничения и ограничени данни за обучение никой от тях не е успял да създаде песни с особено сложна композиция или висока степен на достоверност.

MusicLM е може би първият, който може да направи това.

Подробно описан в академична статия, MusicLM е обучен върху набор от данни с 280 000 часа музика, за да се научи да генерира съгласувани песни за описания със както се изразяват създателите – „значителна сложност“ (например „омагьосваща джаз песен със запомнящо се саксофонно соло и соло певица“ или „берлинско техно от 90-те години с нисък бас“. Забележително е, че песните му звучат по начин, по който би могъл да ги композира човек-изпълнител, макар и невинаги толкова изобретателен или музикално достоверен.

Трудно е да се преувеличи колко добре звучат семплите, като се има предвид, че в цикъла няма музиканти или инструменталисти. Дори когато се захранва с малко дълги и криволичещи описания, MusicLM успява да улови нюанси като инструментални рифове, мелодии и настроения.

Заглавието на извадката по-долу, например представя „предизвикваща преживяване на изгубване в пространството“ и със сигурност предоставя това:

Ето още една извадка, генерирана от описание, което гласи „Основен саундтрак на аркадна игра“:

Възможностите на MusicLM се простират отвъд генерирането на кратки мелодии на песни. Изследователите от Google показват, че системата може да се основава на съществуващи мелодии, независимо дали са припявани, пяти или свирени на инструмент. Нещо повече, MusicLM може да вземе няколко последователно написани описания (например „време за медитация“, „време за събуждане“, „време за тичане“, „време за даване на 100%“) и да създаде нещо като мелодична „история“ или разказ с дължина до няколко минути – напълно подходящ за саундтрак на филм.

Вижте по-долу, което произлиза от последователността „електронна песен, изпълнена във видеоигра“, „песен за медитация, изпълнена до река“, „огън“, „фойерверки“.

Това не е всичко. MusicLM може също така да дава инструкции чрез комбинация от картина и надпис или да генерира аудио, което се „свири“ от определен вид инструмент в определен жанр. Може да се зададе дори нивото на опит на „ИИ музиканта“, а системата може да създава музика, вдъхновена от места, епохи или изисквания (например мотивационна музика за тренировки).

Но MusicLM със сигурност не е безупречна система – всъщност далеч не е такава. Някои от семплите са с изкривено качество – неизбежен страничен ефект от процеса на обучение. И макар че MusicLM може технически да генерира вокали, включително хорови хармонии, те оставят много за желаене. Повечето от „текстовете“ варират от едва ли не английски език до чиста проба бърборене, изпълнени от синтезирани гласове, които звучат като сбирщина от няколко изпълнители.

Въпреки това изследователите на Google отбелязват многото етични предизвикателства, които поставя система като MusicLM, включително тенденцията да включва материали, защитени с авторски права, от учебните данни в генерираните песни. По време на експеримент те установяват, че около 1% от музиката, генерирана от системата е директно възпроизведена от песните, върху които е била обучавана – праг, който очевидно е достатъчно висок, за да ги откаже от пускането на MusicLM в сегашния ѝ вид.

„Признаваме риска от потенциално присвояване на творческо съдържание, свързано със случая на употреба“, пишат съавторите на статията. „Силно подчертаваме необходимостта от повече бъдеща работа за справяне с тези рискове, свързани с генерирането на музика.“

Ако приемем, че MusicLM или подобна на нея система един ден стане достъпна изглежда неизбежно, че на преден план ще излязат сериозни правни въпроси – дори ако системите са позиционирани като инструменти в помощ на творците, а не като техни заместители. Това вече се случва, макар и около по-прости системи с изкуствен интелект. През 2020 година звукозаписната компания на Джей-Зи подаде искове за защита на авторските права срещу канала в YouTube, Vocal Synthesis, за това, че е използвал ИИ, за да създава кавъри на песни на Джей-Зи като „We Didn’t Start the Fire“ на Били Джоел. След като първоначално премахва видеоклиповете, YouTube ги възстановява, като установява, че исканията за премахване са били „непълни“. Но дълбоко-фалшифицираната музика все още стои на неясна правна основа.

Ерик Сънрей, понастоящем стажант-юрист в Асоциацията на музикалните издатели, твърди, че генераторите на музика с изкуствен интелект като MusicLM нарушават авторското право върху музиката, като създават „гоблени от кохерентен звук от произведенията, които поглъщат в процеса на обучение, като по този начин нарушават правото на възпроизвеждане на Закона за авторското право на САЩ“. След пускането на Jukebox критиците също така поставиха под въпрос дали обучението на модели на изкуствен интелект върху музикален материал, защитен с авторско право, представлява справедлива употреба. Подобни опасения бяха изразени и във връзка с данните за обучение, използвани в системите за изкуствен интелект за генериране на изображения, кодове и текстове, които често се извличат от интернет без знанието на създателите им.

От гледна точка на потребителите, Анди Байо от Waxy предполага, че музиката, генерирана от система за изкуствен интелект, ще се счита за производно произведение, в който случай само оригиналните елементи ще бъдат защитени от авторското право. Разбира се, не е ясно какво може да се счита за „оригинално“ в такава музика; използването на тази музика с търговска цел означава да се навлезе в неизследвани води. Въпросът е по-прост, ако генерираната музика се използва за цели, защитени от принципа на справедливата употреба, като пародия и коментар, но Байо очаква, че съдилищата ще трябва да правят преценки за всеки отделен случай.

Възможно е да не мине много време, преди да има някаква яснота по този въпрос. Няколко съдебни дела, които си проправят път в съдилищата, вероятно ще имат отношение към изкуствения интелект, генериращ музика, включително едно, отнасящо се до правата на изпълнителите, чиито произведения се използват за обучение на системи за изкуствен интелект без тяхното знание или съгласие, но времето ще покаже.


Коментирайте статията в нашите Форуми. За да научите първи най-важното, харесайте страницата ни във Facebook, и ни последвайте в Telegram и Viber или изтеглете приложението на Kaldata.com за Android, iOS и Huawei!

Абонирай се
Извести ме за
guest

0 Коментара
Отзиви
Всички коментари

Нови ревюта

Подобни новини