Деепфаке музика опонаша стил одређеног уметника, укључујући њихов глас. Како је могуће да звучи тако стварно?
Музика је дуго времена могла да избегне свет деепфакеса јер је једноставно било превише компликовано синтетизовати нечији глас. Све се то променило са напретком у АИ технологији. То је резултирало гласовним клоновима познатих уметника који се могу користити за производњу нових вокалних нумера.
Како алати вештачке интелигенције постају доступнији просечним људима, дубока музика је све већи проблем. Ево шта је то и како настаје.
Еволуција Деепфаке музике
Када чујете свог омиљеног извођача како пева на Спотифају или ИоуТубе-у, тешко да мислите да би то могло бити лажно, али напредак вештачке интелигенције је ово учинио стварношћу. Поред лажних слика и видео записа, постоји и дубока музика.
АИ алати могу верно да репродукују нечији певачки глас обучавањем АИ модела на аудио узорцима њиховог гласа. Креирани од стране обожавалаца уметника или љубитеља АИ технологије, све више људи покушава да створи вокалне двојнике.
Људи су годинама покушавали да синтетишу глас користећи компјутер, и то још од 1961. године када је ИБМ 7094 био први рачунар који је певао. Можете чути компјутерски генерисан глас који пева Дејзи Бел у ИоуТубе клипу и покушајте да замислите како је овај тренутак био невероватан.
Брзо премотавање у 21. век и АИ технологија су побољшале квалитет синтетизованог гласа и дозволио нам је да радимо ствари које већина нас до сада није мислила да су могуће, попут клонирања гласова људи.
Само погледајте овај снимак Роберта Никсона који трансформише свој глас у уметника и репера Каниеа Веста. Гледање видео снимка делује језиво, заиста звучи као Кание, али је такође непријатно за гледање. Без превише размишљања о томе како би уметник могао да мисли или осећа, и без дозволе, могло би се посматрати као присвајање нечијег гласа.
За разлику од компјутерске изведбе Даиси Белл, АИ вокално клонирање је у стању да репродукује тачну сличност нечији глас, који укључује све суптилне разлике у тембру које нам помажу да идентификујемо нечији јединствени вокал профил. Међутим, без дозволе и без дозволе, деепфаке музика има озбиљне проблеме, на које ћемо касније доћи.
Како се стварају Деепфаке песме
Користе се различите методе за креирање дубоких лажних песама, али многе од њих користе АИ технологију. Пројекти отвореног кода попут СофтВЦ ВИТС пројекат конверзије певања на ГитХуб-у, на пример, развили су АИ модел који ради оно што пише у свом називу: претвара аудио узорак у певачки глас.
Овај модел узима постојећу аудио датотеку некога ко пева и претвара га у глас неког другог. Ствари као што су текстови и ритам оригиналног гласа се чувају, али се тон, тембар и лични вокални квалитети претварају у глас који је одређен скупом података за обуку.
Имајте на уму да други делови песме могу и даље бити ручно произведени, као што је прављење ритмова и мелодија у истом стилу и жанру као и оригинални извођач.
Да би се направио дубоки лажњак Кание Вестовог гласа, скуп података треће стране је морао да се унесе у СофтВЦ ВИТС модел, који би укључивао узорке правог Каниеовог гласа. Датотеку која садржи скуп података аутор је уклонио, што није изненађујуће с обзиром на мутну легалну територију која може доћи са неовлашћеним скуповима података.
Иако није претворена у комерцијалну апликацију, можете пронаћи верзију СофтВЦ ВИТС модел на Гоогле Цоллаб-у то је једноставније за употребу.
Док се не успоставе етичке и правне границе, могуће је да ће апликације за клонирање гласа које се лако користе искачући – не разликује се превише од апликације Драик.ит која је текстуални опис претворила у песме стилизоване по извођачу Драке. Касније је угашен.
Неки други алати који се користе за креирање деепфаке музике укључују велике језичке моделе као што су ЦхатГПТ, који се може користити за писање текстова у стилу познатог уметника; и ОпенАИ-јев џубокс и Гоогле МусицЛМ, који су генеративни АИ модели који могу креирати музику у сировом аудио облику потпуно од нуле.
Да ли чујете разлику?
Песма коју је креирао анонимни корисник под називом Гхоствритер постала је вирална на ТикТок-у у априлу 2023. године, у великој мери зато што је садржала стихове које су певали уметници Драке и Тхе Веекнд. Наравно, то нису били прави гласови уметника, већ лажни.
Да вокал није био тако добра копија оригинала, можда не би био хит. Уз мало копања, могли сте прилично брзо да сазнате да ли је то права ствар или не, али користећи само уши, могли сте само да претпоставите да ли је аутентично.
Ако желите да идентификују слику генерисану вештачком интелигенцијом постоји бар неколико визуелних аберација које можете потражити. Што се тиче звука, знаци попут звука ниске верности или грешака у нумери не значе много јер су то креативни избори који се користе у музичкој продукцији све време.
Оно што је још интересантније је да се многима искрено свиђа песма, чак и након што су открили да то нису прави гласови Дрејка или Тхе Веекнда. Обожаваоци су истакли да није све једноставно генерисано помоћу вештачке интелигенције, и да су права вештина и рад ушли у писање текстова, компоновање ритмова и састављање целе ствари.
Песма је стигла на Спотифај и Јутјуб пре него што је уклоњена наредних дана, али не пре него што су фанови преузели песму као мп3. Још увек можете пронаћи копије песме на мрежи ако претражујете „Хеарт Он Ми Слееве, Драке фт. Викенд".
Ускоро ће уочавање разлике између вокалних клонова генерисаних вештачком интелигенцијом и правог људског гласа постати готово немогуће. Имајући то на уму, људи се питају да ли је ово уопште добра употреба АИ технологије, или чак њена легална употреба.
Проблеми са Деепфаке музиком
С једне стране, људи уживају да слушају мешавине својих омиљених уметника које су направили обожаваоци и поштују креативност која доприноси томе да то постане стварност. Али могућност да се имају вокални клонови на првом месту се ослања на скупове података који могу, али не морају бити овлашћени.
Без дозволе, узорци гласа особе се прикупљају у скуп података који се затим користи за обуку АИ модела конверзије гласа. То је слично проблему са којим се суочава уметници који желе да уклоне своје слике из скупова података за обуку који се користе за обуку АИ генератора слика као што су Далл-Е или Мидјоурнеи.
Закон о ауторским правима није баш спреман да се бави дубоко лажном музиком. 2020. уметник Џеј-Зи није успео у покушају да примора Јутјуб да уклони звук који је генерисао вештачка интелигенција на којем репује репове из монолоквија Вилијама Шекспира „Бити или не бити“.
Када се деепфаке песма постави на Спотифај или ИоуТубе, поставља се и питање ко зарађује. Да ли би требало да можете да зарадите новац на песми која скоро тачно копира нечији глас?
Холли Херндон је једна уметница која је покушала да створи систем за људе да јој надокнаде у замену за коришћење њеног гласовног модела за стварање оригиналног дела. Док други уметници као што је Ник Кејв имају говорио против АИ, пишући:
Песме настају из патње, под тим мислим да су засноване на сложеној, унутрашњој људској борби стварања и, добро, колико ја знам, алгоритми не осећају.
Понекад, Тексту генерисаном вештачком интелигенцијом може недостајати креативности све у свему, ипак се још увек објављују на мрежи. АИ би могао да доведе до много лоше музике у коју је уложено врло мало труда.
Проналажење равнотеже између музике и вештачке интелигенције
Деепфаке музика је креирана помоћу АИ алата и АИ модела који су обучени на неовлашћеним скуповима података. Неки модели су отвореног кода и слободно доступни, док су други покушаји да се упакују у апликацију прилагођену кориснику.
Како се све више људи дочепа лажних музичких модела или апликација, вреди размислити о утицају на уметника. Добијање сагласности за скупове података за обуку и надокнада за уметника само су неки од проблема који се надвијају над музичком технологијом вештачке интелигенције.