АИ алати у музичкој продукцији нису ништа ново. Али шта је са музиком генерисаном од нуле помоћу вештачке интелигенције? И то је сада реалност.

Генеративна АИ се полако шири на све више дисциплина у креативној индустрији. Почело је са АИ уметничким генераторима, а затим се проширило на писање текстом генерисаним од вештачке интелигенције. Сада можемо додати музику на ту листу.

У блиској будућности, музика генерисана вештачком интелигенцијом, настала од нуле, постаће стварност. У ствари, то је већ могућа са Јукебок-ом, ОпенАИ-овим АИ моделом за прављење музике. Још увек није доступан у апликацији која је једноставна за коришћење и још увек не звучи довољно добро, али алгоритамске кости су ту.

Ево шта треба да знате о ОпенАИ-јевом џубоксу и шта можете да урадите са њим.

Џубокс: АИ који генерише музику као сирови звук

Џубокс је неуронска мрежа која може да генерише музику у сировом аудио облику када јој дате унос попут жанра, уметника или текста. Издала га је у априлу 2020. ОпенАИ, иста компанија која нам је донела АИ арт генератор под називом Далл-Е и АИ цхатбот под називом ЦхатГПТ.

За разлику од Далл-Е, који се брзо проширио широм света и учинио АИ грозничавом темом вести и медија, Јукебок није регистровао широк спектар интересовања након објављивања. Један од разлога за то је тај што нема веб апликацију прилагођену кориснику — барем не још.

Код можете пронаћи на ОпенАИ веб локација, заједно са детаљним објашњењем како функционишу процеси кодирања и декодирања.

Други вероватни разлог је тај што је за то потребно огромна количина времена и рачунарске снаге. Да бисмо вам дали идеју, за репродукцију звука од само једног минута може бити потребно 9 сати. Биће вам потребна спремност да истражите модел у његовом кодном облику, плус много стрпљења ако желите да видите шта АИ модел може да уради да генерише музику.

Или, можете прескочити на Јукебок Сампле Екплорер. Овде је ОпенАИ објавио своје експерименте са генерисањем песама налик Елла Фитзгералд или 2Пац.

Да се ​​разумемо, други АИ музички алати постоје да вам помогну да генеришете песму, али не генеришу звук од нуле. Уместо тога, они или комбинују унапред снимљене узорке или креирају МИДИ информације које пролазе кроз дигитални синтисајзер.

Како звучи џубокс?

Резултати Џубокса су препознатљиви, али чудни. Није тешко разумети облик песме и жанр којем припада, већ квалитет резултата чини да звучи као да слушате неку од најраније снимљене музике: то јест, пригушену са доста бука.

Може се рећи да џубокс не производи звук високе верности који бисте чули из пар добрих слушалица. То је више слично слушању музике са радио станице која није у потпуности подешена на праву фреквенцију. Неке песме су поновна извођења, док су друге наставке постојећих песама. Постоји и категорија за нове уметнике и стилове, и невиђене текстове.

Упркос квалитету звука, рани експериментатори описују да су задивљени језивом лепотом и бизарном природом музике коју ствара Џубокс. „Као звучни запис за документацију о непознатој земљи са непознатом културом“, пише Мерзменцх на Медиум.

Тренутно, резултати су далеко од довољно добрих да копирају, или чак замене музику коју су створили људи, али технологија се брзо креће и ускоро ће модели попут џубокса моћи да остваре те подвиге такође.

Како је обучен ОпенАИ џубокс

Део начина на који је Џубокс у стању да ствара музику која никада раније није постојала је то што је обучен на музици правих музичара. ОпенАИ објашњава да:

„Да бисмо обучили овај модел, претражили смо веб да бисмо саставили нови скуп података од 1,2 милиона песама (од којих је 600.000 на енглеском), упарене са одговарајућим текстовима и метаподацима са ЛирицВики-ја.

Пузање за подацима је пракса коју неке компаније са вештачком интелигенцијом користе за креирање скупа података из којих АИ модел може да учи и доноси одлуке када генерише слику, текст — или у овом случају — музику. Скупови података направљени пописивањем су контроверзни јер се сагласност уопште не добија од власника података. Иако вам неке платформе то дозвољавају искључите свој садржај из скупова података.

Можда мислите да је 1,2 милиона песама много, али за поређење, Далл-Е 2 је обучен на стотинама милиона парова слика-текст са интернета. Имајући то на уму, Џубокс има своја ограничења.

Његов релативно мали базен за обуку не може да обухвати богатство и разноликост људске музике. ОпенАИ је изјавио да је углавном обучен за западну музику, што представља јасну пристрасност у томе коју музику је способан да генерише.

Шта можете да радите са џубоксом?

Дакле, имајући на уму његова ограничења, шта можете да урадите са џубоксом? Брз начин да одговорите на то питање је да кажете шта не можете да урадите са џубоксом.

Пошто је за генерисање једног минута музике потребно скоро пола дана, то није много корисно за производњу музике. Бар не у традиционалном смислу. Обично се музичари крећу напред-назад између свирања на инструменту (импровизовања) и планирања структуре песме. Иста врста експериментисања није могућа са џубоксом.

Пошто у овој фази није лако направити песму са џубоксом, о њој можете размишљати више као о новом начину генерисања музичких узорака. Када генеришете звук који вам се свиђа, можете га користити у својим креативним пројектима као што бисте иначе могли да радите.

Видео испод је резултат тога што је неко користио музику креирану помоћу џубокса да подвуче кратки монтажни видео.

Вештачка интелигенција има широк спектар примена и ван креативних апликација, због чега вреди разумевање шта је вештачка интелигенција и опасности које она представља.

Да ли вас покреће АИ музика?

Музику коју генерише Џубокс није лако одбацити, и упркос својој необичности и језивом, људско-машинском квалитету, она на крају звучи као музика. Док музичка индустрија већ неко време користи АИ алате, могућност да се генерише музика као сирови звук тек је сада стварност.

Али док модели попут Џубокса постоје, они тек треба да буду упаковани у комерцијални алат и још увек не испуњавају могућности људских музичара.