Гоогле-ов МусицЛМ је изгледао обећавајуће са својом способношћу да генерише музику из текстуалних упита. Али након што га је ставио на тест, није се баш показало.
У јануару 2023. Гоогле је најавио МусицЛМ, експериментални АИ алат који би могао да генерише музику на основу текстуалних описа. Поред вести, Гоогле је објавио задивљујући истраживачки рад за МусицЛМ који је многе људе оставио запањеним способношћу да дочарају музику из ваздуха.
С обзиром на текстуални упит, модел је обећао да ће произвести музику високе верности која пружа све врсте описа од жанра до инструмента до апстрактних натписа који описују позната уметничка дела. Сада када је МусицЛМ отворен за јавност, одлучили смо да га тестирамо.
Гоогле-ов покушај да направи АИ музички генератор
Претварање текстуалног одзива као што је „опуштајући џез“ у нумеру спремну за репродукцију је вероватно свети грал експеримената у музици вештачке интелигенције. Слично познатим АИ генераторима слика као што су Далл-Е или Мидјоурнеи, не морате имати ни мрвицу музичког знања да бисте произвели нумеру која има мелодију и ритам.
У мају 2023., они који су се пријавили на Гоогле-ову АИ Тест Китцхен могли су први пут испробати демо. Поздравља вас веб страница прилагођена кориснику и неколико водећих правила—електронских и класичних инструменти раде најбоље и не заборавите да наведете „вибру“—производња музичког исечка је незамисливо лако.
Брзина је једна од ретких ствари које МусицЛМ заиста пружа, уз релативно високе узорке. Међутим, прави тест није требало мерити само штоперицом. Може ли МусицЛМ произвести праву музику која се може слушати на основу неколико речи? Не баш (ускоро ћемо доћи до овога).
Како користити МусицЛМ у Гооглеовој АИ тест кухињи
Коришћење МусицЛМ-а је једноставно, можете се пријавити на листу чекања за Гоогле-ова АИ тестна кухиња ако хоћеш да пробаш.
У веб апликацији ћете видети оквир за текст у којем можете да саставите упит од неколико речи до неколико реченица које описују врсту музике коју желите да чујете. За најбоље резултате, Гугл вам саветује да „будете веома дескриптивни“, додајући да треба да покушате да укључите расположење и емоцију музике.
Када будете спремни, притисните ентер да бисте започели обраду. У року од око 30 секунди, два аудио исечка ће вам бити доступна за аудицију. Од ова два, имате опцију да доделите трофеј најбољем узорку који одговара вашем упиту, што заузврат помаже Гоогле-у да обучи модел и побољша његов резултат.
Како МусицЛМ звучи
Људи стварају музику од пре најмање 40.000 година без дефинитивне идеје да ли је музика настала пре, после или у исто време са развојем језика. Дакле, на неки начин, није изненађујуће што МусицЛМ није сасвим разбио код ове древне универзалне уметности.
Гоогле-ов истраживачки рад МусицЛМ сугерисао је да би МусицЛМ могао да генерише музику из наслова који припадају познатим уметничким делима и да их прати упутства попут промене жанра или расположења на глатки начин пратећи низ различитих упити.
Међутим, пре него што смо дошли до тако великих налога, открили смо да МусицЛМ мора прво да превазиђе неколико основних проблема.
Потешкоће у придржавању темпа
Најосновнији посао сваког музичара је једноставно да свира у времену. Другим речима, држите се темпа. Изненађујуће, то није нешто што МусицЛМ може да уради 100% времена.
У ствари, користећи исти упит 10 пута, који производи 20 музичких нумера, само три су биле на време. Преосталих 17 семплова је било брже или спорије од наведеног темпа који је написан у "откуцајима у минути", широко коришћеном термину за описивање музике.
У овом примеру користили смо промпт „соло класични клавир који се свира 80 откуцаја у минути, мирно и медитативно“. Приликом пажљивијег слушања, музика се често убрзава или успорава унутар мале дужине узорка.
Музици је такође недостајао јак ритам и звучала је као да је неко погодио плаи на средини дела. Било да је то било намерно или не, отежава процену да ли МусицЛМ заправо може да компонује прави почетак или крај музичког дела поред тога што се држи ритма.
Случајни избор инструмента
Можда МусицЛМ још није научио како да свира у строгом времену, па смо прешли на још један уобичајени музички параметар. Желели смо да видимо да ли ће то удовољити нашем захтеву за одређене инструменте.
Написали смо неколико различитих упита који су укључивали описе као што су "Соло синтисајзер" и "Соло бас гитара". Други су били већи ансамбли попут „Гудачког квартета” или „Џез бенда”. Све у свему, изгледало је као шанса 50:50 да ћете добити оно што сте тражили.
Једна теорија је да модел неке инструменте повезује са популарним музичким жанровима. Узмимо, на пример, промпт „Соло синтисајзер, прогресија акорда. Живахно и полетно“. Уместо да сам добије звук синтисајзера, МусицЛМ је произвео електронску нумеру са бубњевима и басом.
Могуће је да модел једноставно није имао довољно података и довољно обуке да разуме конкретан захтев за инструментом.
Вокали су ван једначине
Према тадашњим ограничењима, модел не би производио музику која садржи вокале. Мушки проблеми са ауторским правима и лоши вокали МусицЛМ-а је вероватан фактор зашто је Гоогле одлучио да игра на сигурно постављањем овог ограничења.
Али након што смо неко време експериментисали са МусицЛМ-ом, схватили смо да Гуглова контрола над излазом модела није била баш чврста. Чудно, позив попут „акустичне гитаре“ би произвео нумеру која је садржавала вокале попут духова у позадини који су звучали пригушено и удаљено.
Иако ово није уобичајена појава, оставља вас да се запитате о способности МусицЛМ-а да створи убедљиве вокале.
Са софтвером као што су ВОЦАЛОИД и Синтхесизер В који предњаче Технологија вокалне синтезе уз помоћ вештачке интелигенције, изостављање вокала из тренутног модела оставља нас да се питамо да ли још увек није довољно добар да се такмичи са постојећом технологијом. МусицЛМ би могао имати дуг пут пре него што музичари буду певали његове похвале.
Будућност АИ музичких генератора
Иако је МусицЛМ унапредио генеративну музичку технологију вештачке интелигенције, мора да се врати у школу и научи још неколико ствари пре него што може да преузме практичан рад у музичкој индустрији.
До сада, најбољи покушај генеративне АИ музике био је модел под називом ЈукебокАИ од стране ОпенАИ. Није баш био у стању спремном за употребу и било је потребно невероватних девет сати да се прикаже само један минут музике.
За ваше напоре, вероватно ћете добити назад нумеру која заиста звучи ванземаљаца прожета аудио изобличењем и артефактима. Са друге стране, неће вам бити досадно слушајући бизарне креације које џубокс дочарава.
У светлу овога, МусицЛМ је направио значајан напредак ка кориснику прилагођеном АИ музичком генератору. Могли бисмо скоро да опростимо моделу за његове насумичне излазе када застанете и размислите о томе колико је веома компликовано генерисати музику у сировом аудио облику.
Међутим, након пуштања модела у рад, МусицЛМ се осећа напола у поређењу са оним што је Гоогле објавио у свом почетном истраживачком раду. Ретко када АИ генератор слике добије погрешну слику о Аппле-у, исто тако би АИ музички генератор требало да добије неколико основа као што су темпо и инструменти.
Гоогле МусицЛМ не испуњава очекивања
Са технолошким компанијама које се утркују да надмаше једна другу на фронту вештачке интелигенције, МусицЛМ се осећа као да је ушао у јавна испитивања пре него што је био спреман. Уместо исправних основа, чини се да модел заузима далеко нејаснији и субјективнији приступ производњи музике.
Гоогле вас може охрабрити да будете прецизни у свом упиту, али не може добро да поднесе темпо и није вам гарантовано да ћете сваки пут добити инструменте које сте тражили. МусицЛМ може бити занимљив и добра демонстрација моћног АИ напретка, али ако је музика крајњи циљ, пред њом је још дуг пут.