ПаЛМ 2 доноси огромне надоградње Гоогле-овог ЛЛМ-а, али да ли то значи да сада може да иде од прста до пете са ОпенАИ-овим ГПТ-4?
Гоогле је представио следећу генерацију свог језичког модела Патхваис (ПаЛМ 2) 10. маја 2023. на Гоогле И/О 2023. Његов нови модел великог језика (ЛЛМ) може се похвалити доста побољшања у односу на свог претходника (ПаЛМ) и могао би коначно бити спреман да се суочи са својим највећим ривалом, ОпенАИ-овим ГПТ-4.
Али колико је само Гоогле побољшао? Да ли је ПаЛМ 2 прави разлику за коју се Гоогле нада да ће бити, и што је још важније, са толико сличних могућности, по чему се ПаЛМ 2 разликује од ОпенАИ-овог ГПТ-4?
ПаЛМ 2 вс. ГПТ-4: Преглед перформанси
ПаЛМ 2 је препун нових и побољшаних могућности у односу на свог претходника. Једна од јединствених предности које ПаЛМ 2 има у односу на ГПТ-4 је чињеница да је доступан у мањим величинама специфичним за одређене апликације које немају толико уграђене процесорске снаге.
Све ове различите величине имају своје мање моделе под називом Гецко, Оттер, Бисон и Уницорн, при чему је Гецко најмањи, а затим следе Видра, Бисон и на крају, Једнорог, највећи модел.
Гугл такође тврди да је побољшао способности закључивања у односу на ГПТ-4 у ВиноГранде и ДРОП, при чему први повлачи уску маргину у АРЦ-Ц. Међутим, постоји значајан напредак у свим сегментима када су у питању ПаЛМ и СОТА.
ПаЛМ 2 је такође бољи у математици, према Гугловој 91 страници ПаЛМ 2 истраживачки рад [ПДФ]. Међутим, начин на који су Гоогле и ОпенАИ структурирали своје резултате тестирања отежава директно поређење ова два модела. Гугл је такође изоставио нека поређења, вероватно зато што ПаЛМ 2 није био ни приближно тако добар као ГПТ-4.
У ММЛУ, ГПТ-4 је постигао 86,4, док је ПаЛМ 2 постигао 81,2. Исто важи и за ХеллаСваг, где је ГПТ-4 постигао гол 95,3, али ПаЛМ 2 је могао да прикупи само 86,8, а АРЦ-Е, где су ГПТ-4 и ПаЛМ 2 добили 96,3 и 89,7, редом.
Највећи модел у породици ПаЛМ 2 је ПаЛМ 2-Л. Иако не знамо његову тачну величину, знамо да је знатно мањи од највећег ПаЛМ модела, али користи више рачунарства за обуку. Према Гуглу, ПаЛМ има 540 милијарди параметара, тако да би „значајно мањи“ требало да стави ПаЛМ 2 негде између 10 и 300 милијарди параметара. Имајте на уму да су ови бројеви само претпоставке засноване на ономе што је Гоогле рекао у ПаЛМ 2 документу.
Ако је овај број негде близу 100 милијарди или мањи, ПаЛМ 2 је највероватније мањи у смислу параметара од ГПТ-3.5. Узимајући у обзир да модел потенцијално мањи од 100 милијарди може да иде уз ГПТ-4, па чак и да га победи у неким задацима, импресиван. ГПТ-3.5 је у почетку све избацио из воде, укључујући ПаЛМ, али ПаЛМ 2 се прилично опоравио.
Разлике у ГПТ-4 и ПаЛМ 2 подацима о обуци
Иако Гоогле није открио величину скупа података за обуку ПаЛМ 2, компанија у свом истраживачком раду наводи да је нови скуп података за обуку ЛЛМ-а знатно већи. ОпенАИ је такође заузео исти приступ када је открио ГПТ-4, не износећи никакве тврдње о величини скупа података за обуку.
Међутим, Гоогле је желео да се фокусира на дубље разумевање математике, логике, закључивања и науке, што значи да је велики део података о обуци ПаЛМ 2 фокусиран на горе поменуте теме. Гугл у свом раду каже да се корпус пре обуке за ПаЛМ 2 састоји од више извора, укључујући веб документе, књиге, шифре, математику и конверзацијске податке, дајући им побољшања у целости, барем у поређењу са Палма.
Конверзацијске вештине ПаЛМ 2 такође треба да буду на другом нивоу с обзиром да је модел обучен на преко 100 језика како би се пружило боље контекстуално разумевање и бољи превод способности.
Што се тиче података о обуци ГПТ-4, ОпенАИ нам је рекао да је обучио модел користећи јавно доступне податке и податке које је лиценцирао. ГПТ-4 страница за истраживање наводи: „Подаци су корпус података на вебу који укључује исправна и нетачна решења математичких проблема, слаба и снажно образложење, контрадикторне и доследне изјаве и представљање великог броја идеологија и идеје“.
Када се ГПТ-4 постави питање, може произвести широк спектар одговора, од којих сви не могу бити релевантни за ваш упит. Да би га ускладио са намером корисника, ОпенАИ је фино подесио понашање модела користећи учење уз помоћ људи.
Иако можда не знамо тачне податке о обуци на којима је било који од ових модела обучен, знамо да је намера обуке била веома различита. Мораћемо да сачекамо и видимо како се ова разлика у намерама обуке разликује између два модела у примени у стварном свету.
ПаЛМ 2 и ГПТ-4 чет-ботови и услуге
Први портал за приступ оба ЛЛМ-а користи њихове одговарајуће цхат ботове, ПаЛМ 2 Бард и ГПТ-4 ЦхатГПТ. Уз то, ГПТ-4 стоји иза паивалл-а са ЦхатГПТ Плус-ом, а бесплатни корисници добијају приступ само ГПТ-3.5. Бард је, с друге стране, бесплатан за све и доступан у 180 земаља.
То не значи да не можете бесплатно приступити ГПТ-4. Мицрософт-ов Бинг АИ Цхат користи ГПТ-4 и потпуно је бесплатан, отворен за све и доступан одмах поред Бинг претраге, Гоогле-овог највећег ривала у свемиру.
Гоогле И/О 2023 био је испуњен најавама о томе како ће ПаЛМ 2 и генеративна АИ интеграција побољшати Гоогле Воркспаце искуство са АИ функцијама које долазе у Гоогле документе, табеле, слајдове, Гмаил и скоро сваку услугу коју гигант за претрагу нуди. Поред тога, Гоогле је потврдио да је ПаЛМ 2 већ интегрисан у преко 25 Гоогле производа, укључујући Андроид и ИоуТубе.
За поређење, Мицрософт је већ донео АИ функције у Мицрософт Оффице пакет програма и многе његове услуге. У овом тренутку, можете искусити оба ЛЛМ-а у њиховим сопственим верзијама сличних понуда две ривалске компаније које се боре у борби против вештачке интелигенције.
Међутим, пошто је ГПТ-4 изашао рано и пазио да избегне многе грешке које је Гоогле направио са оригиналним Бардом, то је био де фацто ЛЛМ за програмере треће стране, стартапе и скоро све који желе да уграде способан АИ модел у своју услугу, тако да далеко. Имамо листу ГПТ-4 апликација ако желите да их проверите.
То не значи да програмери неће прећи на ПаЛМ 2 или барем испробати ПаЛМ 2, али Гоогле и даље мора да се ухвати у коштац са ОпенАИ-ом на том фронту. А чињеница да је ПаЛМ 2 отвореног кода, уместо да је закључан иза плаћеног АПИ-ја, значи да има потенцијал да буде шире прихваћен од ГПТ-4.
Може ли ПаЛМ 2 да се носи са ГПТ-4?
ПаЛМ 2 је још увек веома нов, тако да остаје да се одговори на то да ли може да преузме ГПТ-4 или не. Међутим, са свиме што Гоогле обећава и агресивним начином на који је одлучио да га пропагира, изгледа да ПаЛМ 2 може дати ГПТ-4 трку за свој новац.
Међутим, ГПТ-4 је и даље прилично способан модел и, као што је већ поменуто, побеђује ПаЛМ 2 у доста поређења. Ипак, вишеструки мањи модели ПаЛМ 2 дају му непобитну предност. Сам Гецко је толико лаган да може да ради на мобилним уређајима, чак и када је ван мреже. То значи да ПаЛМ 2 може да подржи потпуно другачију класу производа и уређаја који би могли имати проблема са коришћењем ГПТ-4.
АИ трка се загрева
Са лансирањем ПаЛМ2, трка за доминацију вештачке интелигенције се захуктала, јер би ово могао бити само први достојан противник који се бори против ГПТ-4. Са новијим мултимодалним АИ моделом названим „Близанци“ такође у обуци, Гугл овде не показује знаке успоравања.