ОпенАИ је дао ЦхатГПТ-у могућност да говори синтетизованим гласом и ускоро ће доћи на ваш паметни телефон.

ЦхатГПТ је постављен да постане интерактивно генеративно искуство вештачке интелигенције. ОпенАИ је открио да ће водећи светски АИ цхатбот моћи да говори и одговара на корисничке упите користећи синтетизовани глас, вероватно генерисан од вештачке интелигенције.

Заједно са својим новооткривеним гласом, ЦхатГПТ ће такође моћи да одговори и дискутује о одређеним сликама које су отпремљене на њега или снимљене док користите ЦхатГПТ Андроид или иОС апликацију. Функција препознавања слике звучи слично као Гоогле Ленс и друге апликације које користе неуронске мреже за прецизно откривање података и информација.

ОпенАИ даје глас ЦхатГПТ-у

25. септембра 2023, ЦхатГПТ програмер Открио је ОпенАИ то би дало глас свом водећем светском генеративном АИ цхатботу. Корисници ЦхатГПТ-а могу да разговарају директно са четботом и захтевају од њега да одговори, што ефективно омогућава ЦхатГПТ-у да по први пут разговара директно гласом.

instagram viewer

ОпенАИ-јев пример клипа приказује жену која тражи од ЦхатГПТ-а да направи јединствену причу за спавање, на коју ЦхатГПТ прописно одговара женским синтетизованим гласом.

Према Виред, нови модел претварања текста у говор је развијен у компанији. Може да генерише "људски" звук из текста и неколико секунди примера говора (користећи ОпенАИ Вхиспер модел) и говоре разним тоновима и стиловима. Можете пронаћи низ гласовних узорака на ОпенАИ блог.

Неке компаније већ користе ОпенАИ-ов нови гласовни модел. На пример, Спотифи користи ОпенАИ-ов модел претварања текста у говор за превођење подцаста на различите језике, комбинујући ЦхатГПТ-ову способност превођења језика са новом способношћу говора.

ЦхатГПТ-ов нови модел претварања текста у говор доступан је само претплатницима Плус и Ентерприсе који користе званичну Андроид и иОС апликације и очекује се да ће се појавити у наредне две недеље (почев од 25. 2023). Штавише, нова гласовна функција је за почетак ограничена на енглески, мада бисмо очекивали да ће се ово брзо променити.

ЦхатГПТ може да препозна и анализира слике и фотографије

Други део ОпенАИ-овог ЦхатГПТ ажурирања је могућност анализе и разговора слика које су учитане у алатку. Опција визуелне анализе слике је представљена у видео снимцима за ажурирање ГПТ-4, али се од тада о њој није много расправљало (Тумач кодова за ЦхатГПТ на страну).

Сада ЦхатГПТ добија функционалност сличну Гоогле Ленс-у. Можете да отпремите слику на ЦхатГПТ или снимите фотографију помоћу камере паметног телефона у апликацији ЦхатГПТ, а она ће детаљније приказати слику, додајући више контекста где је то потребно.

Називање „слично Гоогле сочиву“ заиста чини неправду. Могућност ћаскања напред-назад о слици ради добијања више информација и контекста чини је изузетно корисним за широк спектар подешавања. Међутим, важно је напоменути ситно писмо, при чему је ОпенАИ јасно ставио до знања да има ограничену ЦхатГПТ-ову „способност да анализира и даје директне изјаве о људима“ из разлога приватности и тачности. Ипак, да ли би ОпенАИ-ов алат „Ко је ово“ могао бити у раду у будућности? (Надајмо се да не!)

Као и нови модел претварања текста у говор, ОпенАИ ће представити препознавање слика у наредне две недеље, иако ће бити доступно на свим платформама, не само у апликацији ЦхатГПТ.

Приватност, безбедност и друга питања

Импликације ЦхатГПТ-а са гласовним напајањем су оштре. Наравно, узбудљиво је. Међутим, могућност стварања јединствено синтетизованог гласа користећи само кратки исечак као пример има значајна питања приватности и безбедности. Потенцијал злонамерних актера да искористе ове алате је огроман, и као и код сваког генеративног АИ алата, када дух изађе из боце, апсолутно се неће вратити унутра. Ниједна регулација АИ од влада или вођа мисли не може вратити ток уназад.

Чини се да чак и упозорење ОпенАИ-а на ову тему заобилази очигледно упркос помињању проблема:

Међутим, ове могућности представљају и нове ризике, као што је могућност да се злонамерни актери лажно представљају као јавне личности или почине превару. Због тога користимо ову технологију за покретање специфичног случаја употребе — гласовног ћаскања.

С обзиром на то да је ово врх леденог брега, очекујте отпор против новооткривеног гласа ЦхатГПТ-а, посебно једном постоји предвидљив пораст неукусних наслова који тврде да се ЦхатГПТ користи за вршење преваре и тако на.

ОпенАИ претвара ЦхатГПТ у АИ апликацију

Што више ОпенАИ додаје функције прилагођене кориснику у ЦхатГПТ, то више постаје генеративна АИ апликација. Као први који је достигао широку славу током почетног бума генеративне вештачке интелигенције, ЦхатГПТ и даље води и само апликација која се користи, упркос конкуренцији попут Гоогле Бард-а (и потенцијално Гоогле Гемини-а) и Антхропиц-а Цлауде.

Све док ОпенАИ може да настави да додаје функције које олакшавају коришћење ЦхатГПТ-а, он ће људе држати привученима и све више приближавати свом циљу истински мултимодалног АИ алата.