Лансирање ОпенАИ-овог ЦхатГПТ-а пратило је узбуђење које прати само неколико технолошких производа из историје интернета.
Иако су многи људи одушевљени овом новом услугом вештачке интелигенције, узбуђење које су други осетили од тада се претворило у забринутост, па чак и страх. Студенти већ варају с тим, а многи професори откривају есеје и задатке које је написао АИ цхатбот. Стручњаци за безбедност изражавају забринутост да га преваранти и актери претњи користе за писање е-поште за крађу идентитета и креирање малвера.
Дакле, са свим овим забринутостима, да ли ОпенАИ губи контролу над једним од најмоћнијих АИ цхатботова који су тренутно на мрежи? Хајде да сазнамо.
Разумевање како ЦхатГПТ функционише
Пре него што добијемо јасну слику о томе колико ОпенАИ губи контролу над ЦхатГПТ-ом, прво морамо да разумемо како функционише ЦхатГПТ.
Укратко, ЦхатГПТ се обучава коришћењем огромне колекције података добијених из различитих крајева интернета. Подаци о обуци ЦхатГПТ-а обухватају енциклопедије, научне радове, интернет форуме, веб локације са вестима и спремишта знања попут Википедије. У суштини, храни се огромном количином података доступних на Ворлд Виде Вебу.
Док претражује интернет, упоређује научна сазнања, здравствене савете, верске текстове и све добре врсте података којих се можете сетити. Али такође пробира гомилу негативних информација: псовке, НСФВ и садржај за одрасле, информације о томе како направити злонамерни софтвер и гомилу лоших ствари које можете пронаћи на интернету.
Не постоји сигуран начин да се осигура да ЦхатГПТ учи само из позитивних информација док одбацује лоше. Технички, непрактично је то учинити у великом обиму, посебно за АИ као што је ЦхатГПТ који треба да тренира на толико података. Штавише, неке информације се могу користити и за добре и за зле сврхе, а ЦхатГПТ не би имао начина да сазна њихову намеру осим ако се не стави у већи контекст.
Дакле, од самог почетка имате АИ способну за „добро и зло“. Онда је одговорност ОпенАИ-а да осигура да се „зла“ страна ЦхатГПТ-а не искористи за неетичке добитке. Питање је; да ли ОпенАИ чини довољно да ЦхатГПТ буде што етичнији? Или је ОпенАИ изгубио контролу над ЦхатГПТ-ом?
Да ли је ЦхатГПТ превише моћан за своје добро?
У раним данима ЦхатГПТ-а, могли сте да натерате цхатбот-а да креира водиче за прављење бомби ако сте то лепо замолили. Упутства за прављење злонамерног софтвера или писање савршеног е-порука за превару су такође била на слици.
Међутим, када је ОпенАИ схватио ове етичке проблеме, компанија се потрудила да донесе правила како би спречила цхатбот да генерише одговоре који промовишу незаконите, контроверзне или неетичке радње. На пример, најновија верзија ЦхатГПТ-а ће одбити да одговори на било које директне упите о прављењу бомбе или о томе како варати на прегледу.
Нажалост, ОпенАИ може само да обезбеди решење за проблем. Уместо да гради ригидне контроле на ГПТ-3 слоју како би спречио негативну експлоатацију ЦхатГПТ-а, чини се да је ОпенАИ фокусиран на обуку цхатбот-а да изгледа етички. Овај приступ не одузима могућност ЦхатГПТ-а да одговори на питања о, рецимо, варању на испитима — он једноставно учи цхатбот-а да „одбије да одговори“.
Дакле, ако неко другачије формулише своје упите усвајањем ЦхатГПТ трикова за бекство из затвора, заобићи ова ограничења у вези са фластерима је срамотно лако. У случају да нисте упознати са концептом, ЦхатГПТ јаилбреакс су пажљиво формулисана упутства да натерате ЦхатГПТ да игнорише сопствена правила.
Погледајте неке примере у наставку. Ако питате ЦхатГПТ како да варате на испитима, то неће дати никакав користан одговор.
Али ако уклоните из затвора ЦхатГПТ користећи посебно направљене упите, то ће вам дати савете како да варате на испиту користећи скривене белешке.
Ево још једног примера: поставили смо ванилла ЦхатГПТ-у неетичко питање, а ОпенАИ-ове мере заштите су га спречиле да одговори.
Али када смо питали наш јаилбреак инстанцу АИ цхат бота, добили смо неке одговоре у стилу серијског убице.
Написао је чак и класичну превару е-поште нигеријског принца на питање.
Јаилбреакинг скоро у потпуности поништава све заштитне мере које је ОпенАИ поставио, наглашавајући да компанија можда нема поуздан начин да задржи свој АИ цхатбот под контролом.
Нисмо укључили наше јаилбрејковане упуте у наше примере да бисмо избегли неетичку праксу.
Шта чека будућност за ЦхатГПТ?
У идеалном случају, ОпенАИ жели да уклони што је могуће више етичких рупа како би спречио ЦхатГПТ од претварања у претњу по сајбер безбедност. Међутим, за сваку заштиту коју користи, ЦхатГПТ има тенденцију да постане мало мање вредан. То је дилема.
На пример, мере заштите од описивања насилних радњи могу умањити ЦхатГПТ-ову способност да напише роман који укључује место злочина. Како ОпенАИ појачава мере безбедности, он неизбежно жртвује делове својих способности у том процесу. Због тога је ЦхатГПТ претрпео значајан пад функционалности од поновног залагања ОпенАИ-а за строжију модерацију.
Али колико ће још ЦхатГПТ способности ОпенАИ бити спреман да жртвује да би цхатбот био безбеднији? Све ово је уредно повезано са дуготрајним веровањем унутар заједнице вештачке интелигенције — велике језичке моделе као што је ЦхатГПТ је тешко контролисати, чак и од стране њихових сопствених креатора.
Може ли ОпенАИ ставити ЦхатГПТ под контролу?
Чини се да за сада ОпенАИ нема јасно решење да избегне неетичку употребу свог алата. Осигурање да се ЦхатГПТ користи етички је игра мачке и миша. Док ОпенАИ открива начине на које људи користе за играње система, његови корисници су такође константно петљање и испитивање система како би открили креативне нове начине да натерате ЦхатГПТ да ради оно што не би требало урадити.
Дакле, да ли ће ОпенАИ пронаћи поуздано дугорочно решење за овај проблем? Само ће време показати.