Пре више од 70 година, када је вештачка интелигенција концептуализована, Алан Туринг је објавио рад који описује како да је идентификујемо. Касније је био познат као Тјурингов тест и користио се деценијама за разликовање човека од вештачке интелигенције.
Међутим, са увођењем напредних АИ цхатбота као што су ЦхатГПТ и Гоогле Бард, постаје све теже рећи да ли разговарате са АИ. Поставља питање; да ли је Тјурингов тест застарео? А ако јесте, које су алтернативе?
Да ли је Тјурингов тест застарео?
Да бисте утврдили да ли је Тјурингов тест застарео, прво морате разумети како то функционише. Да би вештачка интелигенција прошла Тјурингов тест, мора да убеди иследника да је човек. Али постоји квака - АИ се процењује заједно са човеком и мора да одговори помоћу текста.
Размислите о томе овако; ако сте испитивач и постављате питања двојици учесника на мрежи користећи текст, али један од њих је АИ модел — да ли бисте их раздвојили након пет минута? Имајте на уму да циљ Тјуринговог теста није да идентификује модел вештачке интелигенције на основу тачних одговора, већ да процени да ли АИ може да размишља или да се понаша као човек.
Проблем са приступом Тјуринговог теста који се односи само на идентификацију одговора сличних људима је тај што не узима у обзир друге факторе. На пример, интелигенција АИ модела или знање испитивача. Осим тога, Тјурингов тест је ограничен само на текст и постаје све теже идентификовати вештачку интелигенцију која генерише људски глас или деепфаке видео снимци који имитирају људско понашање.
Међутим, тренутни АИ модели као што су ЦхатГПТ-4 и Гоогле Бард још увек нису напредовали до тачке да могу доследно да прођу Тјурингов тест. У ствари, ако сте упознати са АИ, можете спот који је генерисао АИ.
5 најбољих алтернатива Тјуринговог теста
Могуће је да будући модели вештачке интелигенције као што је ЦхатГПТ-5 могао да прође Тјурингов тест. Ако се то догоди, биће нам потребни различити тестови у комбинацији са Тјуринговим тестом да бисмо утврдили да ли разговарамо са вештачком интелигенцијом или са човеком. Ево најбољих алтернатива Тјуринговог теста:
1. Маркусов тест
Гери Маркус, познати когнитивни научник и истраживач вештачке интелигенције, предложио је алтернативу Тјуринговом тесту који је објављен у Нев Иоркер да идентификује когнитивне способности АИ. Тест је једноставан - ви процењујете АИ модел на основу његове способности да гледа и разуме ИоуТубе видео снимке и ТВ емисије без титлова или текста. Да би вештачка интелигенција прошла Маркусов тест, требало би да разуме сарказам, хумор, иронију и причу када гледа видео снимке и да то објасни као човек.
Овог тренутка, ГПТ-4 може описати слике, али до сада, тренутно не постоји АИ модел који може да разуме видео записе као човек. Самовозећа возила приближите се, али нису потпуно аутономни и захтевају сензоре јер не могу да разумеју све у свом окружењу.
2. Визуелни Тјурингов тест
Према истраживачком раду објављеном на ПНАС, визуелни Тјурингов тест се може користити за идентификацију да ли разговарате са човеком или вештачком интелигенцијом помоћу упитника за слике. Ради као Тјурингов тест, али уместо да одговарају на питања користећи текстове, учесницима се приказују слике и очекује се да одговоре на једноставна питања док размишљају као људи. Међутим визуелни Тјурингов тест се разликује од ЦАПТЦХА пошто су сви одговори тачни—али да би прошао тест, вештачка интелигенција мора да обрађује слике на сличан начин као човек.
Осим тога, ако се АИ и човеку покаже више слика једна поред друге и замоли се да идентификују реалистичне слике, човек би имао когнитивну способност да прође тест. То је зато што је АИ моделима тешко разликовати слике које не изгледају као да су снимљене у стварном свету. У ствари, то је разлог зашто можете идентификују слике генерисане вештачком интелигенцијом користећи аномалије које немају смисла.
3. Тест Ловелаце 2.0
Теорију да компјутер не може да створи оригиналне идеје изван онога за шта је програмиран први пут је концептуализовала Ада Ловелаце пре Тјуринговог теста. Међутим, Алан Туринг се успротивио тој теорији тврдећи да АИ и даље може изненадити људе. Тек 2001. године развијене су смернице за Ловелаце тест како би се разликовала АИ од човека — и, према тхекурзвеиллибрари правила су касније ревидирана 2014.
Да би вештачка интелигенција прошла Ловелаце тест, мора да покаже да може да генерише оригиналне идеје које превазилазе њену обуку. Тренутни АИ модели као што је ГПТ-4 немају способност да смисле нове проналаске изван нашег постојећег знања. Међутим, вештачка општа интелигенција може постићи ту способност и проћи Ловелаце тест.
4. Обрнути Тјурингов тест
Шта кажете на Тјурингов тест, али урађен обрнуто? Уместо да покушавате да сазнате да ли разговарате са човеком, циљ је обрнути Тјурингов тест је преварити АИ да поверује да сте АИ. Међутим, потребан вам је и други АИ модел да бисте одговорили на иста питања користећи текст.
На пример, ако је ЦхатГПТ-4 испитивач, можете да упишете Гоогле Бард и још једног човека као учеснике. Ако АИ модел може исправно да идентификује људског учесника на основу одговора, он је прошао тест.
Лоша страна обрнутог Тјуринговог теста је та што је непоуздан, посебно с обзиром на то понекад АИ не може разликовати АИ генерисану и људски писани садржај.
5. Оквир класификације АИ
Према класификационом оквиру АИ који је развио Цхрис Саад, Тјурингов тест је само један од метода евалуације да бисте сазнали да ли разговарате са АИ. Сажетије речено, класификациони оквир АИ је заснован на теорији вишеструке интелигенције, која захтева да људска интелигенција задовољи најмање осам различитих критеријума, који укључују: музичко-ритам, логичко-математичку интелигенцију, визуелну идентификацију, емоционалну интелигенцију, саморефлексивну интелигенцију, способност егзистенцијалног размишљања и тело кретање.
Пошто се АИ процењује на основу осам различитих параметара, мало је вероватно да ће проћи за човека чак и ако ради боље од просека у одређеним мерилима. На пример, ЦхатГПТ може да реши математичке проблеме, описују слике и разговарају на природном језику попут човека, али то неће успети у другим категоријама дефинисаним у оквиру класификације АИ.
Тјурингов тест није коначан
Тјурингов тест је требало да буде више мисаони експеримент него коначан тест за разликовање људи од вештачке интелигенције. Када је првобитно предложен, био је кључно мерило за мерење интелигенције машина.
Међутим, са недавним развојем АИ модела са говорним, визуелним и слушним интерактивним могућностима, Тјурингов тест је недовољан јер је ограничен на текстуални разговор. Најефикасније решење би било да се уведу алтернативе Тјуринговог теста које додатно разликују АИ моделе од људи.