Пре само неколико месеци, ако сте желели да направите слику нечега, морали сте да будете у могућности да скицирате, сликате или користите неки од алата за фотошопинг о којима други стално говоре. Међутим, после 2022. све се променило, а све захваљујући вештачкој интелигенцији — да, као у „вештачкој интелигенцији“.

Уместо да покушавају да доминирају светом, уметнички настројени АИ алати могу све што им опишете претворити у слику.

Пођите са нама док улазимо у свет визуелизације текста засноване на вештачкој интелигенцији и видите како можете да користите такве алате да претворите своје мисли у стварне слике једноставним куцањем онога што имате на уму.

Далл-Е: Уметничка страна ОпенАИ ГПТ-3

Први алати са АИ који су постали популарни били су засновани на ОпенАИ ГПТ-3. Један од разлога је била отвореност пројекта за екстерни приступ, што је довело до неких сугестија да ГПТ-3 је будућност креативног рада.

Данас можете користити званичне алате које можете пронаћи на ОпенАИ-јев бета сајт или решења трећих страна која искоришћавају његове језичке супермоћи. На пример, можете замолити ГПТ-3 да направи нацрт за пост, одговори на једноставна питања, или чак ревидира или преведе неки текст.

2022. ОпенАИ је открио да је ГПТ-3 подједнако добар у прављењу слика. Пројекат ДАЛЛ-Е, игра на Пиксаровом филму ВАЛЛ-Е и Далијевом имену, користи ГПТ-3 не за рад са текстом, већ као механизам за прављење слика.

Баш као и код ГПТ-3 и текста, ДАЛЛ-Е заправо није креативни геније, материјализујући слике из ничега. Уместо тога, „обучен“ је на милионима слика које већ постоје на мрежи. Његове АИ моћи леже у анализи тих слика, узимању елемената из њих, подешавању, преобликовању, прилагођавању и коначно комбиновању у нове слике.

Барем, то је поједностављена верзија онога што се дешава у позадини. Већини људи ће бити стало само до онога што виде испред себе, а то је оквир за текст у који можете да откуцате нешто и видите да се то претворило у слику након неколико минута.

Гоогле-ов одговор на слике

Гугл је један од три најбоља „играча“ у истраживању вештачке интелигенције. Ипак, њихов напредак није лако уочљив, нити су његове имплементације у производе тако доступне као ОпенАИ понуде.

Једна од првих широко доступних имплементација Гоогле АИ била је у Гоогле документима и Гмаил-у, у облику интелигентнијег аутоматског довршавања и предлога, познатих као Смарт Цомпосе. Нећемо урањати у детаље пошто смо претходно покрили Паметно састављање (и како можете да га користите).

Када су те функције активне, Гоогле-ове веб апликације упоређују оно што корисник куца са оним што су милиони других писали у прошлости. Затим сугерише оно што су касније откуцали.

То је доказ да упркос ономе у шта волимо да верујемо, нисмо толико различити. Ако 99 од 100 људи откуца „касније“ после „видимо се“, вероватно бисмо то и ми наставили да куцамо.

Сви смо користили неки облик аутоматског довршавања, чак и из времена Т9 система за предвиђање текста у ери „думфона“. Зато Гоогле-ови АИ алати нису изгледали тако интелигентни као ОпенАИ ГПТ-3. Нису се осећали више у употреби него бољи Т9 систем побољшан за 21. век. И зато је Имагеново откриће било помало шок.

Као ДАЛЛ-Е на стероидима, Имаген је алатка за визуелизацију текста. На основу онога што је данас доступно, Имаген може да произведе „чишће“ и живописније слике, а истовремено зна како да се носи са напредним функцијама као што су дифузија и транспарентност.

Нажалост, у време писања овог текста, приступ Имаген-у је остао ограничен, тако да нисмо могли да га испробамо.

ДАЛЛ-Е Мини и пријатељи: Отворени за посао

Још увек не можете слободно да приступите ДАЛЛ-Е и Имаген-у. Ипак, многе алтернативе су већ доступне ако желите да се зезате са генерисањем текстуалних слика помоћу вештачке интелигенције.

Имајући на уму да су то рани дани, а резултати или корисничко искуство које они нуде могу бити далеко од оптималног, ипак вреди проверити неке од следећих.

Прављење мемова помоћу Далл-Е Мини

Захваљујући комбинацији више него адекватних резултата и корисничког интерфејса, али што је још важније, његове широке доступности, ДАЛЛ-Е мини је постао један од најпопуларнијих визуелизатора АИ текста.

Далеко од савршених, понекад би резултати ДАЛЛ-Е мини могли бити апстрактнији него што је планирано.

Други пут можда неће успети да створи оно што сте имали на уму, али може се прилично приближити.

Након његове експлозије у популарности, креатори ДАЛЛ-Е мини-а преселили су га у нови дом под новим брендом. Сада можете пронаћи најновију верзију ДАЛЛ-Е мини као Цраиион на сопственом сајту.

Коришћење Цраииона данас је једноставно као и претраживање постојеће слике на мрежи. Можете да посетите његову веб локацију, укуцате опис своје слике у њено текстуално поље и притиснете Ентер. После неког времена видећете резултате на екрану.

Оно што је упадљиво је колико су Цраиион и слични алати добри у опонашању визуелних стилова. На пример, замолили смо га да дочара слике штенета на скејтборду:

Затим смо користили тачну фразу, али смо после ње додали „Пикар стил“. После неког времена, Цраиион је приказао мрежу више „цртаних“ слика, ближих ономе што видимо као Пикарову графику праћену зрацима у њиховим омиљеним филмовима.

Цраиион нам је дао још боље резултате када смо заменили „Пикар стил“ са „аниме стилом“ у истом позиву.

Аниме је више стилизован у свом изгледу од Пикар-ових реалистичнијих слика, што је изгледа помогло Цраииону да направи неке слике које су скоро спремне за употребу.

Фоолинг Ароунд Витх Латент Диффусион

Модел латентне дифузије обучен на скупу података ЛАИОН-400М је још један занимљив визуелизатор АИ текста. Међутим, такође је компликованија у употреби. Морате га покренути на мрежи у виртуелној машини и играти се са његовим различитим параметрима уместо да само куцате у текстуално поље. Ипак, лакше је него што звучи.

  1. Посетите Гоогле Латент Диффусион цолаб простор то је тренутно његов дом.
  2. Померите се мало надоле и приметите Промпт поље под Параметерс. Замените подразумевани упит оним што желите да ваша слика приказује.
  3. Изабери Покрени све од Рунтиме мени или притисните ЦТРЛ + Ф9.
  4. Ако желите да можете да извезете произведене слике директно из алатке, одговорите позитивно на питање да ли желите да је повежете са својим налогом на Гоогле диску. Алат треба неко време да заврши своју конфигурацију и треба да преузме неке датотеке током процеса.

Повећање вредности за Степс, Итерације, и Самплес_ин_параллел, може довести до детаљнијих резултата. Међутим, алатка је изузетно захтевна у погледу ресурса на Гоогле-овим серверима. Као резултат тога, може се срушити ако превише повећате те вредности или процес креирања одређене слике постаје компликованији него што се очекивало.

Интерестинг Алтернативес

Провели смо значајну количину времена тестирајући ДАЛЛ-Е мини и латентну дифузију. Наш научни метод се састојао од два различита дела. Прво, морали смо да смислимо концепте који би се могли тачно описати као луди. Затим замолите те АИ визуализаторе да их претворе у слике. Чешће него што се очекивало, успевали су, приближавајући се општој поставци коју смо замислили.

Испробали смо и неке од доступних алтернатива за овај чланак. Још увек чекамо приступ другима. Неке од оних које вреди погледати су (без одређеног редоследа):

  • Мидјоурнеи
  • МиндсЕие бета
  • СтарриАИ
  • Дреам
  • Дисцо Диффусион

Да ли ће уметност генерисана вештачком интелигенцијом заменити визуелне уметности?

Обиље и континуирано растућа популарност алата који стварају слике помоћу вештачке интелигенције наводе многе на закључак да ће визуелна уметност ускоро умрети. Која је сврха улагати време и енергију да научите како да цртате или користите компликовани софтвер за визуелизацију ствари када вештачка интелигенција то може да уради брже (и ускоро боље) од вас?

Ако сте приметили, сви ти алати су „обучени за скупове података“. На обичном енглеском, то значи да раде оно што раде захваљујући томе што су људи већ радили исту ствар раније.

То је наговештај зашто ти алати не могу заменити људску уметност, креативност и домишљатост. Они су имитације, паметни репликатори. Без људски произведених оригинала на којима су обучени, не би могли да произведу никакав резултат.

Ипак, то је сада, а признајемо да не знамо шта нам доноси будућност. За сада, визуелни уметници могу безбедно да спавају. Међутим, темпом који се АИ развија, многи стручњаци за ову тему слажу се да није ствар у томе да ли ће икада заиста заменити рад људи попут вашег. Само је питање када.

Али хеј, није све пропаст. Док се Скинет спрема да преузме наше послове, бар можемо да улепшамо расположење тако што ћемо без напора креирати слике штенаца на скејтбордовима!