ГПТ-4 је ту, а ово су нове функције које треба да проверите.
ОпенАИ је коначно лансирао своје дуго очекивано ГПТ ажурирање, ГПТ-4. Модел великог језика (ЛЛМ) долази са неким моћним новим функцијама и могућностима које су већ шокирале кориснике широм света.
Поред тога што је значајно бољи од ГПТ-3.5, постојећи ЛЛМ који покреће ОпенАИ-јев вирусни цхатбот ЦхатГПТ, ГПТ-4 може разуме сложеније уносе, има далеко веће ограничење уноса знакова, има мултимодалне могућности и наводно је безбеднији за користити.
1. ГПТ-4 може да разуме сложеније улазе
Једна од највећих нових карактеристика ГПТ-4 је његова способност да разуме сложеније и нијансиране упите. Према ОпенАИ, ГПТ-4 "показује перформансе на нивоу човека на различитим професионалним и академским мерилима."
Ово је показано стављањем ГПТ-4 кроз неколико испита на нивоу човека и стандардизованих тестова, као што су САТ, БАР и ГРЕ, без посебне обуке. Не само да је ГТП-4 разумео и решио ове тестове са релативно високим резултатом у целини, већ је сваки пут победио свог претходника, ГПТ-3.5.
Способности да се разумеју нијансиранији упити за унос такође помаже чињеница да ГПТ-4 има много веће ограничење речи. Нови модел може да обрађује упите за унос до 25.000 речи (за контекст, ГПТ-3.5 је био ограничен на 8.000 речи). Ово ће директно утицати на детаље које корисници могу угурати у своје упите, дајући на тај начин моделу много више информација за рад и стварајући дуже излазе.
ГПТ-4 такође подржава преко 26 језика, укључујући језике са малим ресурсима као што су летонски, велшки и свахили. Када се мери тачност од три ударца на ММЛУ мерилу, ГПТ-4 је победио ГПТ-3.5 као и друге водеће ЛЛМ као што су ПаЛМ и Цхинцхилла у погледу перформанси на енглеском језику на 24 језика.
2. Мултимодал Цапабилитиес
Претходна верзија од ЦхатГПТ био ограничен само на текстуалне упите. Насупрот томе, једна од најновијих карактеристика ГПТ-4 су његове мултимодалне могућности. Модел може прихватити и текстуалне и сликовне упите.
То значи да АИ може да прихвати слику као улаз и да је тумачи и разуме баш као текстуални упит. Ова могућност обухвата све величине и типове слика и текста, укључујући документе који комбинују то двоје, ручно нацртане скице, па чак и снимке екрана.
Међутим, могућности читања слика ГПТ-4 превазилазе само њихово тумачење. ОпенАИ је ово приказао у свом тому за програмере (изнад), где су ГПТ-4 обезбедили ручно нацртани модел веб странице за шалу. Модел је добио задатак да напише ХТМЛ и ЈаваСцрипт код како би макету претворио у веб локацију док је шале заменио стварним.
ГПТ-4 је написао код док је користио распоред наведен у моделу. Након тестирања, код је произвео радни сајт са, као што можете претпоставити, стварним шалама. Значи Напредак АИ ће значити крај програмирања? Не баш, али то је и даље функција која ће добро доћи у помоћ програмерима.
Колико год ова функција изгледала обећавајуће, још увек је у прегледу истраживања и није јавно доступна. Поред тога, моделу је потребно доста времена за обраду визуелних инпута, а сам ОпенАИ наводи да би могао бити потребан рад и време да би постао бржи.
3. Већа управљивост
ОпенАИ такође тврди да ГПТ-4 има висок степен управљивости. Такође је отежало АИ да разбије карактер, што значи да је мања вероватноћа да ће пропасти када се имплементира у апликацију за играње одређеног лика.
Програмери могу прописати стил и задатак своје вештачке интелигенције тако што ће описати правац у поруци „система“. Ове поруке омогућавају корисницима АПИ-ја да у великој мери прилагоде корисничко искуство у одређеним границама. Пошто су ове поруке уједно и најлакши начин за „бекство из затвора“ модела, оне такође раде на томе да буду безбедније. Демо за ГПТ-4 је закуцао ову тачку тако што је навео корисника да покуша да спречи ГПТ-4 да буде сократов тутор и одговори на њихов упит. Међутим, модел је одбио да сломи карактер.
4. Сигурност
ОпенАИ је провео шест месеци правећи ГПТ-4 сигурније и усклађеније. Компанија тврди да је 82% мање вероватно да ће одговорити на захтеве за неприкладан или на други начин недозвољен садржај, 29% већа вероватноћа да ће одговори у складу са ОпенАИ-овим политикама на осетљиве захтеве и 40% већа је вероватноћа да ће дати чињеничне одговоре у поређењу са ГПТ-3.5.
Није савршена и још увек можете очекивати да ће с времена на време „халуцинирати“ и може бити погрешна у својим предвиђањима. Наравно, ГПТ-4 има бољу перцепцију и моћ предвиђања, али ипак не треба слепо веровати АИ.
5. Побољшања перформанси
Осим процене перформанси модела на људским испитима, ОпенАИ је такође проценио бот на традиционалним мерилима дизајнираним за моделе машинског учења.
Тврди се да ГПТ-4 „значајно надмашује“ постојеће ЛЛМ и „најсавременије моделе“. Ова мерила укључују горе поменути ММЛУ, АИ2 Реасонинг Цхалленге (АРЦ), ВиноГранде, ХуманЕвал и Дроп, од којих сви тестирају индивидуалне способности.
Сличне резултате ћете наћи када упоредите перформансе на основу академског вида. Покренути тестови укључују ВКАв2, ТектВКА, ЦхартКА, АИ2 дијаграм (АИ2Д), ДоцВКА, Инфограпхиц ВКА, ТВКА и ЛСМДЦ, од којих је ГПТ-4 најбољи. Међутим, ОпенАИ је навео да резултати ГПТ-4 у овим тестовима „не представљају у потпуности обим његових могућности“ јер истраживачи настављају да проналазе нове и изазовније ствари са којима се модел може позабавити.
Мали корак за ГПТ-4, Гиант Леап за АИ
Са већом прецизношћу, безбедношћу коришћења и напредним могућностима, ГПТ-4 је пуштен у јавност преко ЦхатГПТ+ месечног плана претплате који кошта 20 месечно. Поред тога, ОпенАИ се удружио са различитим организацијама како би започео изградњу производа за потрошаче са ГПТ-4. Мицрософт Бинг, Дуолинго, Стрипе, Бе Ми Еиес и Кхан Ацадеми, између осталих, већ су имплементирали ГПТ-4 у своје производе.
ГПТ-4 може бити инкрементално ажурирање у односу на ГПТ-3.5, али је то огромна победа за АИ свеукупно. Како модел постаје приступачнији, како просечном кориснику тако и програмерима преко његовог АПИ-ја, чини се да ће бити добар случај за ЛЛМ имплементације у различитим областима.