Вероватно сте чули за ОпенАИ ГПТ, али они нису једини ЛЛМ у блоку.
Кључне Такеаваис
- ОпенАИ ГПТ-4 је најнапреднији и најшире коришћени модел великог језика, са 1,76 трилиона параметара и мултимодалним способностима.
- Антхропицов Цлауде 2 такмичи се са ГПТ-4 у задацима креативног писања и држи се без обзира на то што има мање ресурса.
- Гоогле-ов ПаЛМ 2, иако није убица ГПТ-4, моћан је језички модел са јаким вишејезичним и креативним способностима. Фалцон-180Б је модел отвореног кода који се може такмичити са комерцијалним гигантима и може стајати прст до пете са ГПТ-3.5.
Сезона је вештачке интелигенције, а технолошке компаније производе велике језичке моделе попут хлеба из пекаре. Нови модели се брзо објављују и постаје превише тешко пратити.
Али усред налета нових издања, само неколико модела се попело на врх и доказало се као прави конкуренти у великом простору језичких модела. Како се приближавамо крају 2023. године, саставили смо шест најупечатљивијих великих језичких модела које бисте требали испробати.
1. ОпенАИ ГПТ-4
ГПТ-4 је најнапреднији јавно доступан модел великог језика до данас. Развијен од стране ОпенАИ и објављен у марту 2023. ГПТ-4 је најновија итерација у серији генеративних унапред обучених трансформатора који је почео 2018. Са својим огромним могућностима, ГПТ-4 је постао један од најчешће коришћених и најпопуларнијих модела великих језика на свету.
Иако није званично потврђено, извори процењују да ГПТ-4 може садржати запањујућих 1,76 билиона параметара, око десет пута више од свог претходника, ГПТ-3.5, и пет пута веће од Гугловог водећег модела, ПаЛМ 2. Ова огромна размера омогућава мултимодалне способности ГПТ-4, омогућавајући му да обрађује и текст и слике као улаз. Као резултат тога, ГПТ-4 може да тумачи и описује визуелне информације попут дијаграма и снимака екрана поред текста. Његова мултимодална природа пружа разумевање података из стварног света налик човеку.
У научним мерилима, ГПТ-4 значајно надмашује друге савремене моделе у различитим тестовима. Док сама мерила перформанси не показују у потпуности предности модела, случајеви коришћења у стварном свету су показали да је ГПТ-4 изузетно способан за интуитивно решавање практичних проблема. ГПТ-4 се тренутно наплаћује по 20 УСД месечно и доступно преко ЦхатГПТ Плус плана.
2. Антхропиц'с Цлауде 2
Иако није толико популаран као ГПТ-4, Цлауде 2, који је развио Антхропиц АИ, може да одговара техничким мерилима ГПТ-4 и перформансама у стварном свету у неколико области. У неким стандардизованим тестовима, укључујући одабране испите, Цлауде 2 је бољи од ГПТ-4. Модел АИ језика такође има знатно супериорнији контекстни прозор на око 100.000 токена, у поређењу са ГПТ -4 моделима од 8к и 32к токена. Иако већа дужина контекста не значи увек боље перформансе, проширени капацитет Цлаудеа 2 пружа јасне предности, као што је варење читавих књига од 75.000 речи за анализу.
У укупним перформансама, ГПТ-4 је и даље супериоран, али наше интерно тестирање показује да га Цлауде 2 превазилази у неколико задатака креативног писања. Цлауде 2 такође прати ГПТ-4 у програмским и математичким вештинама на основу наших процена, али се истиче у пружању људских, креативних одговора. Када смо подстакли све моделе на овој листи да напишу или поново напишу креативно дело, шест пута од десет, изабрали смо резултат Клода 2 због његових природних резултата налик човеку. Тренутно, Цлауде 2 је доступан бесплатно преко Цлауде АИ цхат бота. Постоји и плаћен план од 20 долара за приступ додатним функцијама.
Упркос томе што има мању финансијску подршку од дивова као што су ОпенАИ и Мицрософт, Антхропиц-ов Цлауде 2 АИ модел има своје предности у односу на популарне ГПТ моделе и Гоогле-ову ПаЛМ серију. За вештачку интелигенцију са мање ресурса, Цлауде 2 је импресивно конкурентан. Ако буде приморан да се кладимо на то који постојећи модел има најбоље шансе да парира ГПТ-у у блиској будућности, Цлауде 2 изгледа најсигурнија опклада. Иако надмашује у финансирању, напредне способности Клода 2 сугеришу да може да иде од прста до пете чак и добро финансирани дивови (иако је вредно напоменути да је Гоогле дао неколико великих доприноса Антропски). Модел је изнад своје тежине и показује обећање као изазов у настајању.
3. ОпенАИ ГПТ-3.5
Иако је засенчен издавањем ГПТ-4, ГПТ-3.5 и његових 175 милијарди параметара не треба потцењивати. Кроз итеративно фино подешавање и надоградње фокусиране на перформансе, тачност и безбедност, ГПТ-3.5 је прешао дуг пут од оригиналног ГПТ-3 модела. Иако му недостају мултимодалне могућности ГПТ -4 и заостаје у дужини контекста и броју параметара, ГПТ-3.5 остаје веома способан, а ГПТ-4 је једини модел који може да надмаши своје свестране перформансе одлучно.
Упркос томе што је модел другог реда у ГПТ породици, ГПТ-3.5 може да се држи и чак надмаши Гоогле и Мета водеће моделе на неколико мерила. У паралелним тестовима математичких и програмских вештина у односу на Гоогле-ов ПаЛМ 2, разлике нису биле велике, при чему је ГПТ-3.5 чак имао благу предност у неким случајевима. Креативнији задаци попут хумора и писања нарације довели су до тога да ГПТ-3.5 одлучно напредује.
Дакле, док ГПТ-4 означава нову прекретницу у АИ, ГПТ-3.5 остаје импресивно моћан модел, способан да се такмичи и понекад надмаши чак и најнапредније алтернативе. Његова континуирана префињеност осигурава да остаје релевантан чак и поред блиставијих модела следеће генерације.
4. Гоогле-ов ПаЛМ 2
Када се процењују могућности АИ модела, доказана формула је да се прочита технички извештај и проверите бенцхмарк резултате, али узмите све што сте научили са резервом и тестирајте модел себе. Колико год изгледало контраинтуитивно, резултати бенцхмарка нису увек усклађени са перформансама у стварном свету за неке АИ моделе. На папиру, Гоогле-ов ПаЛМ 2 је требало да буде убица ГПТ-4, са званичним резултатима теста који сугеришу да одговара ГПТ-4 у неким мерилима. Међутим, у свакодневној употреби, појављује се другачија слика.
У логичком закључивању, математици и креативности, ПаЛМ 2 заостаје за ГПТ-4. Такође заостаје за Антропиковим Клодом у низу задатака креативног писања. Међутим, иако не успева да испуни своје наплате као убица ГПТ-4, Гоогле-ов ПаЛМ 2 остаје моћан језички модел сама по себи, са огромним могућностима. Велики део негативног расположења око њега произилази из поређења са моделима као што је ГПТ-4, а не из потпуно лоших перформанси.
Са 340 милијарди параметара, ПаЛМ 2 је међу највећим светским моделима. Посебно се истиче у вишејезичним задацима и поседује снажне математичке и програмске способности. Иако није најбољи у томе, ПаЛМ 2 је такође прилично ефикасан у креативним задацима попут писања. Дакле, док су бенцхмаркови дали оптимистичну слику која се није у потпуности остварила, ПаЛМ 2 и даље показује импресивне АИ вештине, чак и ако не надмашује све конкуренте широм света.
5. ТИИ-ов Фалцон-180Б
Осим ако нисте пратили брзи темпо издавања модела језика вештачке интелигенције, вероватно се никада нисте сусрели са Фалцон-180Б. Развијен од стране Института за технолошке иновације УАЕ, параметар од 180 милијарди Фалцон-180 један је од најмоћнијих модели језика отвореног кода, чак и ако им недостаје препознавање имена ГПТ модела или широка употреба Мета Лама 2. Али немојте погрешити - Фалцон-180Б може да стоји прст до пете са најбољима у класи.
Резултати бенцхмарк-а откривају да Фалцон-180Б надмашује већину модела отвореног кода и да се такмичи са комерцијалним џугернаутима попут ПаЛМ 2 и ГПТ-3.5. У тестирању задатака из математике, кодирања, закључивања и креативног писања, чак је превазишао ГПТ-3.5 и ПаЛМ 2 на пута. Ако рангирамо ГПТ-4, ГПТ-3.5 и Фалцон-180Б, поставили бисмо Фалцон-180Б равно између ГПТ-4 и ГПТ-3.5 због његових предности у неколико случајева употребе.
Иако не можемо са сигурношћу рећи да је бољи од ГПТ-3.5 у укупним перформансама, то је доказ за себе. Иако нејасан, овај модел заслужује пажњу због усклађивања или превазилажења могућности познатијих алтернатива. Можете испробати модел Фалцон-180Б Хуггинг Фаце (платформа за ЛЛМ отвореног кода).
Ллама 2, велики језички модел Мета АИ са 70 милијарди параметара, надограђује се на свог претходника, Ллама 1. Иако је мањи од водећих модела, Ллама 2 значајно надмашује већину јавно доступних ЛЛМ-ова отвореног кода у референтним вредностима и употреби у стварном свету. Изузетак би био Фалцон-180Б.
Тестирали смо Лламу 2 против ГПТ-4, ГПТ-3.5, Цлауде 2 и ПаЛМ 2 да бисмо проценили његове могућности. Није изненађујуће, ГПТ-4 је надмашио Лламу 2 по скоро свим параметрима. Међутим, Ллама 2 се држао против ГПТ-3.5 и ПаЛМ 2 у неколико процена. Иако би било нетачно тврдити да је Ллама 2 супериоран у односу на ПаЛМ 2, Ллама 2 је решио многе проблеме који су збунили ПаЛМ 2, укључујући задатке кодирања. Цлауде 2 и ГПТ-3.5 су надмашили Лламу 2 у неким областима, али су били одлучно бољи само у ограниченом броју задатака.
Дакле, не превазилазећи могућности највећих власничких модела, опен-соурце Ллама 2 удара изнад своје тежине. За модел који је отворено доступан, он показује импресивне перформансе, парирајући гигантима вештачке интелигенције као што је ПаЛМ 2 у одабраним оценама. Ллама 2 пружа увид у будући потенцијал језика отвореног кода.
Разлика у перформансама између АИ модела се сужава
Иако се АИ пејзаж развија великом брзином, ОпенАИ ГПТ-4 остаје лидер у пакету. Међутим, док ГПТ-4 остаје без премца у размерама и перформансама, модели попут Цлауде 2 показују да са довољно вештине, мањи модели могу да се такмиче у одабраним областима. Гоогле-ов ПаЛМ 2, упркос томе што није испунио нека висока очекивања, и даље показује дубоке могућности. А Фалцон-180Б доказује да иницијативе отвореног кода могу да стоје раме уз раме са индустријским титанима који имају довољно ресурса.