ГПТБот вероватно није оно што мислите.

Кључне Такеаваис

  • ОпенАИ ГПТБот је веб претраживач дизајниран за прикупљање података са јавних веб локација, који се затим користе за обуку и побољшање АИ модела као што су ГПТ-4 и ЦхатГПТ.
  • Неке од највећих веб локација на интернету блокирају ГПТБот јер приступа и користи садржај заштићен ауторским правима без дозволе или накнаде креаторима.
  • Иако веб локације могу да користе алатке као што је роботс.ткт да покушају да блокирају ГПТБот, не постоје гаранције да ће се ОпенАИ придржавати, дајући им контролу над приступом подацима заштићеним ауторским правима.

У августу 2023., ОпенАИ, АИ моћник заслужан за развој ЦхатГПТ-а, најавио је ГПТБот, веб претраживач дизајниран за кретање кроз веб и прикупљање података.

Недуго након те објаве, неке од највећих веб локација на интернету блокирале су боту да приступи њиховој веб локацији. Али зашто? Шта је ОпенАИ ГПТБот? Зашто се велики веб-сајтови плаше тога и зашто покушавају да га блокирају?

Шта је ОпенАИ ГПТбот?

instagram viewer

ГПТБот је веб претраживач који је креирао ОпенАИ за претраживање интернета и прикупљање информација за развојне циљеве ОпенАИ-ја АИ. Програмиран је да претражује јавне веб странице и шаље податке назад на ОпенАИ сервере. ОпенАИ затим користи ове податке за обуку и побољшање својих АИ модела, са циљем изградње све напреднијих система вештачке интелигенције. За прављење софистицираних АИ модела као што је ГПТ-4 или његових подређених производа као што је ЦхатГПТ, веб индексери су скоро неопходни.

Обука АИ модела захтева огромну количину података, а један од најефикаснијих начина за прикупљање ових података је примена алата као што су веб претраживачи. Пописивачи могу систематски да претражују веб, прате везе да индексирају велике количине веб страница и издвајају кључне податке попут текста, слика и метаподатака који одговарају унапред дефинисаном шаблону.

Ови подаци се затим могу структурирати и унети у АИ моделе како би обучили њихове способности обраде природног језика или способности генерисања слика или их обучили за друге АИ задатке. Речју по реду, веб пописивачи прикупљају податке који омогућавају алатима као што су ЦхатГПТ или ДАЛЛ-Е да раде оно што раде.

Веб пописивачи нису нов концепт. Вероватно их има милионе који индексирају милијарде веб локација које су данас доступне на интернету. И постоје барем од раних 90-их. ГПТБот је само један од таквих претраживача у власништву ОпенАИ. Дакле, шта изазива контроверзу око овог конкретног веб претраживача?

Зашто велике техничке локације блокирају ГПТБот?

Према Бусинесс Инсидер, неке од највећих веб локација на интернету активно блокирају ОпенАИ-ов пописивач на својој веб локацији. Дакле, ако је крајњи циљ ГПТБота да унапреди развој вештачке интелигенције, зашто су неке од највећих веб локација на интернету, од којих су неке на овај или онај начин имале користи од вештачке интелигенције, против тога?

Па, ево у чему је ствар. Од поновног избијања генеративних технологија вештачке интелигенције 2022. године, постојале су бројне дебате о праву АИ компанија да користи, готово без ограничења, податке са интернета, чији је значајан део законски заштићен Ауторско право. Нема јасних закона који регулишу како ове компаније прикупљају и користе податке за сопствену добит.

Дакле, у основи, пописивачи као што је ГПТБот претражују веб, грабе креативни рад људи у облику текста, слика или других облика медије, и користити их у комерцијалне сврхе без добијања било какве дозволе, лиценце или обештећења оригиналу ствараоци.

Тамо је дивљи запад, а компаније са вештачком интелигенцијом грабе све што им дође под руку. Велике веб странице попут Куора, ЦНН, Нев Иорк Тимес, Бусинесс Инсидер и Амазон нису баш задовољни што су Ови пописивачи прикупљају садржај заштићен ауторским правима, тако да ОпенАИ може имати финансијску корист од тога на свом трошак.

Због тога ови сајтови примењују „роботс.ткт“, деценијама стару методу за блокирање веб пописивача. Према ОпенАИ, ГПТБот ће поштовати упутства за пописивање или избегавање пописивања веб локација на основу правила уграђених у роботс.ткт, малу текстуалну датотеку која говори веб пописивачима како да се понашају на сајту. Ако имате сопствену веб локацију и волели бисте да спречите ГПТБот да преузме ваше податке, ево како можете блокирајте ОпенАИ-јеве пописиваче да уклоне вашу веб локацију.

Могу ли веб странице заиста зауставити ГПТБот?

Док су претраживачи као што је ГПТБот неопходни за прикупљање огромне количине података потребних за обучите напредне системе вештачке интелигенције, постоји оправдана забринутост у вези са ауторским правима и поштеном употребом која не може бити игнорисано.

Наравно, постоје једноставни алати као што је роботс.ткт који се могу користити за заштиту од овога, али да ли ГПТБот поштује упутства у овој датотеци је у потпуности на дискрецији ОпенАИ. Не постоје гаранције да ће то учинити, и не постоји непосредан сигуран начин да се каже да ли су то урадили. У борби да задржи ГПТБот од података заштићених ауторским правима, ОпенАИ држи асове, барем за сада.