АИ може да нас превари да погрешно генерисану уметност заменимо за праве фотографије. Па зашто су руке тако велики изазов?
Генератори вештачке интелигенције еволуирају пред нашим очима застрашујућим темпом, али и даље имају недостатке. Уочавање чудних детаља на АИ сликама је заправо прилично смешно. Зато су Мидјоурнеи руке постале врућа тема, проблем уобичајен у многим моторима.
Хајде да разјаснимо зашто руке толико изазивају АИ генераторе слика. Њихови програмери већ решавају овај проблем вредан мема, али занимљиво је размишљати о томе како вештачка интелигенција учи, а да не спомињемо шта јој се нађе на путу.
Зашто су руке генерисане вештачком интелигенцијом изазвале узбуђење
Свако ко користи АИ моторе за креирање слика можда је приметио да руке ретко излазе како треба, али проблем је скренуо пажњу када се гомила „фотографија“ појавила на Твитеру.
При пажљивијем прегледу, чудне руке људи су их издале као слике генерисане вештачком интелигенцијом. Чињеница да је ово био Мидјоурнеијев покушај учинила је ситуацију занимљивијом.
Један од најбољих АИ мотора није могао да се ухвати у коштац са замршеношћу људских руку, па су способности Мидјоурнеија и његових конкурената стављене на пробу. Истина, чак је и ДАЛЛ-Е склон нереалним прстима и ноктима.
Хипе је било ван пропорције, с обзиром на то да су руке генерисане вештачком интелигенцијом увек биле проблем, али додатна пажња је подстакла објављивање Мидјоурнеи в5 за побољшање в4.
Нова верзија је указала на побољшање дизајна руку, што је јасан показатељ да су АИ инжењери обратили пажњу на урнебесно узбуђење и одлучили да надограде могућности софтвера.
Други мотори споро следе Мидјоурнеијев пример, тако да поправљање АИ уметности помоћу Пхотосхопа остаје непроцењива вештина. Главна препрека за програмере је колико је компликовано тренирати вештачку интелигенцију да црта убедљиве руке.
Зашто се АИ генератори слика боре са рукама?
АИ мотори користе генеративне адверсаријске мреже (ГАН) или стабилну дифузију за производњу слика. Обе технологије захтевају обимне изворне материјале, обуку и процесорску снагу за креирање чак и најосновнијих уметничких дела.
Пошто су постојеће слике централне за обуку вештачке интелигенције, програмери морају да хране свој софтвер хиљадама, ако не и милионима слика поред упита—понављање процеса изнова и изнова док машина не схвати на шта се одређена реч односи и како то да представи објекат.
Али изворне слике из којих АИ учи углавном су 2Д, где су руке приказане у различитим позицијама. Било право или увијено, са пет или три прста.
На крају крајева, машина заправо не разуме концепт руку, а слике из којих учи не приказују увек руке довољно јасно или доследно. Зато руке на Мидјоурнеиу могу бити тако ружне: АИ конфузија.
Колико важи као Забринутост Елона Маска за развој вештачке интелигенције можда, неки делови технологије имају још много да науче. А њихове препреке превазилазе недовољне примере руку.
Други разлози зашто се АИ генератори слика споро побољшавају
Гледа у Модели Мидјоурнеи, в5 нуди напредну кохерентност између текстуалних упита и произведених слика, као и већу резолуцију и додатне алате. Али таква достигнућа нису јефтина.
Обука вештачке интелигенције да ради боље рукама захтева да јој храните боље слике, посебно у 3Д. То значи да се много времена и радне снаге троши на процесе, од набавке изворних материјала до побољшања кодирања и понављања обуке све док АИ не исправи то како треба.
Чак и тада, софтвер може направити грешке у иначе запањујућим уметничким делима. Осим што је огроман и сложен посао, скуп је. Дакле, не очекујте бесплатни АИ генератори текста у слику да још стигнемо до Мидјоурнеијевог калибра.
Једноставно речено, проблем са АИ моторима није само у немогућности ових компјутерских програма да у потпуности разумеју како изгледају или раде људске карактеристике попут руку и стопала. Такође се своди на то колико кошта, као и на приступ технологије 3Д сликама и техникама машинског учења које могу помоћи генераторима да стекну реалистичније схватање света око себе.
АИ генератори слика неће се борити заувек
Руке су лукав концепт за вештачку интелигенцију да омота своју бинарну главу, али решења проблема су већ на делу. Мидјоурнеи, ДАЛЛ-Е 2 и друге платформе ће на крају моћи да задрже необичне прсте на минимуму, ако не и да их потпуно искорене.
Напредак у другим областима вештачке интелигенције обезбеђује да се технологија непрестано развија, а њени програмери увек уче нове начине да је примењују и побољшају.