Модели великих језика (ЛЛМ) су основна технологија која је покренула метеорски успон генеративних АИ цхат робота. Алати као што су ЦхатГПТ, Гоогле Бард и Бинг Цхат се ослањају на ЛЛМ за генерисање људских одговора на ваше упите и питања.
Али шта су ЛЛМ и како функционишу? Овде смо кренули да демистификујемо ЛЛМ.
Шта је модел великог језика?
Најједноставније речено, ЛЛМ је огромна база података текстуалних података на које се може референцирати за генерисање људских одговора на ваше упите. Текст долази из низа извора и може износити милијарде речи.
Међу уобичајеним изворима текстуалних података који се користе су:
- Књижевност: ЛЛМ често садрже огромне количине савремене и класичне литературе. Ово може укључивати књиге, поезију и драме.
- Онлине садржај: ЛЛМ ће најчешће садржати велико складиште онлајн садржаја, укључујући блогове, веб садржај, питања и одговоре на форуму и други текст на мрежи.
- Вести и актуелности: Неки, али не сви, ЛЛМ могу приступити актуелним темама вести. Одређени ЛЛМ, попут ГПТ-3.5, су ограничени у овом смислу.
- Друштвени медији: Друштвени медији представљају огроман ресурс природног језика. ЛЛМ користе текст са главних платформи као што су Фацебоок, Твиттер и Инстаграм.
Наравно, имати огромну базу података текста је једна ствар, али ЛЛМ морају бити обучени да разумију то како би произвели људске одговоре. Како то ради је оно о чему ћемо даље говорити.
Како раде ЛЛМ?
Како ЛЛМ користе ова спремишта да креирају своје одговоре? Први корак је анализа података помоћу процеса који се зове дубоко учење.
Дубоко учење се користи за идентификацију образаца и нијанси људског језика. Ово укључује стицање разумевања граматике и синтаксе. Али што је важно, то такође укључује контекст. Разумевање контекста је кључни део ЛЛМ-а.
Погледајмо пример како ЛЛМ могу да користе контекст.
Упозорење на следећој слици помиње виђење слепог миша ноћу. Из овога је ЦхатГПТ схватио да говоримо о животињи, а не, на пример, о бејзбол палици. Наравно, други цхат ботови воле Бинг Цхат или Гоогле Бард може одговорити на ово потпуно другачије.
Међутим, није непогрешиво, и као што овај пример показује, понекад ћете морати да пружите додатне информације да бисте добили жељени одговор.
У овом случају, намерно смо бацили мало закривљене лопте да покажемо како се лако губи контекст. Али људи такође могу погрешно да схвате контекст питања, и потребна му је само додатна порука да се исправи одговор.
Да би генерисали ове одговоре, ЛЛМ користе технику која се зове генерисање природног језика (НЛГ). Ово укључује испитивање уноса и коришћење образаца научених из његовог спремишта података да би се генерисао контекстуално исправан и релевантан одговор.
Али ЛЛМ иду дубље од овога. Они такође могу да прилагоде одговоре тако да одговарају емоционалном тону уноса. Када се комбинују са контекстуалним разумевањем, ова два аспекта су главни покретачи који омогућавају ЛЛМ-има да створе одговоре налик људима.
Да резимирамо, ЛЛМ користе огромну текстуалну базу података са комбинацијом дубоког учења и НЛГ техника за креирање људских одговора на ваше упите. Али постоје ограничења за оно што се овим може постићи.
Која су ограничења ЛЛМ-а?
ЛЛМ представљају импресивно технолошко достигнуће. Али технологија је далеко од савршене, и још увек постоји много ограничења у погледу онога што могу постићи. Неки од најзначајнијих од њих су наведени у наставку:
- Контекстуално разумевање: Ово смо споменули као нешто што ЛЛМ укључују у своје одговоре. Међутим, они то не схватају увек како треба и често нису у стању да разумеју контекст, што доводи до неприкладних или једноставно погрешних одговора.
- Склоност: Било која пристрасност присутна у подацима о обуци често може бити присутна у одговорима. Ово укључује предрасуде према полу, раси, географији и култури.
- Здрав разум: Здрав разум је тешко квантификовати, али људи то уче од раног детињства само посматрајући свет око себе. ЛЛМ немају ово инхерентно искуство на које би се могли вратити. Они разумеју само оно што им је дато кроз податке о обуци, а то им не даје право разумевање света у коме постоје.
- ЛЛМ је добар онолико колико су добри његови подаци о обуци: Тачност се никада не може гарантовати. Стара компјутерска изрека „Смеће у, смеће напоље“ савршено сажима ово ограничење. ЛЛМ су добри онолико колико им квалитет и квантитет података о обуци дозвољавају.
Такође постоји аргумент да се етички проблеми могу сматрати ограничењем ЛЛМ-а, али ова тема не спада у оквир овог чланка.
3 Примера популарних ЛЛМ
Континуирани напредак АИ сада је у великој мери подржан од стране ЛЛМ. Дакле, иако нису баш нова технологија, они су сигурно достигли тачку критичног замаха, а сада постоји много модела.
Ево неких од најчешће коришћених ЛЛМ-ова.
1. ГПТ
Генеративни унапред обучени трансформатор (ГПТ) је можда најпознатији ЛЛМ. ГПТ-3.5 покреће ЦхатГПТ платформу која се користи за примере у овом чланку, док је најновија верзија, ГПТ-4, доступна преко ЦхатГПТ Плус претплате. Мицрософт такође користи најновију верзију на својој Бинг Цхат платформи.
2. ЛаМДА
Ово је почетни ЛЛМ који користи Гоогле Бард, Гоогле-ов АИ цхатбот. Верзија са којом је Бард првобитно представљена је описана као "лака" верзија ЛЛМ-а. Моћнија ПаЛМ итерација ЛЛМ-а је заменила ово.
3. БЕРТ
БЕРТ је скраћеница од Би-дирецтионал Енцодер Репресентатион фром Трансформерс. Двосмерне карактеристике модела се разликују БЕРТ од других ЛЛМ као што је ГПТ.
Много више ЛЛМ-ова је развијено, а изданци су уобичајени од главних ЛЛМ-ова. Како се буду развијали, они ће наставити да расту у сложености, тачности и релевантности. Али шта је будућност за ЛЛМ?
Будућност ЛЛМ-а
Ово ће несумњиво обликовати начин на који ћемо сарађивати са технологијом у будућности. Брзо усвајање модела као што су ЦхатГПТ и Бинг Цхат сведочи о овој чињеници. У кратком року, Мало је вероватно да ће вас вештачка интелигенција заменити на послу. Али још увек постоји неизвесност о томе колику ће велику улогу они имати у нашим животима у будућности.
Етички аргументи још увек могу да утичу на то како интегришемо ове алате у друштво. Међутим, стављајући ово на страну, неки од очекиваних развоја ЛЛМ-а укључују:
- Побољшана ефикасност:Са ЛЛМ-овима који садрже стотине милиона параметара, они су невероватно гладни ресурса. Уз побољшања хардвера и алгоритама, они ће вероватно постати енергетски ефикаснији. Ово ће такође убрзати време одговора.
- Побољшана контекстуална свест:ЛЛМ се самообучавају; што више употребе и повратних информација добију, постају бољи. Оно што је важно, ово је без икаквог даљег већег инжењеринга. Како технологија буде напредовала, ово ће довести до побољшања језичких способности и контекстуалне свести.
- Обучени за специфичне задатке: Оптимални алати који су јавно лице ЛЛМ-а су склони грешкама. Али како се развијају и корисници их обучавају за специфичне потребе, ЛЛМ могу играти велику улогу у областима као што су медицина, право, финансије и образовање.
- Већа интеграција: ЛЛМ би могли постати лични дигитални асистенти. Помислите на Сири на стероидима и схватићете. ЛЛМ би могли постати виртуелни асистенти који вам помажу у свему, од предлагања оброка до бављења вашом преписком.
Ово су само неке од области у којима ће ЛЛМ вероватно постати већи део начина на који живимо.
ЛЛМ трансформација и образовање
ЛЛМ отвара узбудљив свет могућности. Брз пораст четботова као што су ЦхатГПТ, Бинг Цхат и Гоогле Бард доказ је ресурса који се преливају на терен.
Таква пролиферација ресурса може само да види да ови алати постају моћнији, свестранији и тачнији. Потенцијалне примене таквих алата су огромне, а тренутно само загребемо површину невероватног новог ресурса.