Технологија препознавања гласа има богату историју развоја која ју је довела до данашњег стања. То је срж савременог живота и даје нам могућност да обављамо задатке само разговором са уређајем. Дакле, како се ова запањујућа технологија развијала годинама? Хајде да погледамо.

1952: Одри систем

Први корак у препознавању гласа учињен је почетком 1950 -их. Белл Лабораториес је 1952. развила прву машину која је могла да разуме људски глас, а названа је Аудреи Систем. Име Аудреи било је нека врста контракције израза Аутоматско препознавање цифара. Иако је ово била велика иновација, имала је нека велика ограничења.

Најважније, Аудреи је могла препознати само бројчане знаменке 0-9, без ријечи. Аудреи би дала повратну информацију када би говорник изговорио број паљењем 1 од 10 сијалица, од којих свака одговара цифри.

Кредит за слику: метаморворкс/Схуттерстоцк.цом

Иако је могла да разуме бројеве са 90% тачности, Аудреи је била ограничена на одређени тип гласа. Због тога је једина особа која би га заиста користила био ХК Давис, један од програмера. Када се изговорио број, говорник би морао да сачека најмање 300 милисекунди пре него што изговори следећи.

instagram viewer

Не само да је био ограничен у функционалности, већ је био ограничен иу корисности. Није било много користи од машине која је могла да разуме само бројеве. Једна од могућих употреба било је бирање телефонских бројева, али било је много брже и лакше бирање бројева ручно. Иако Аудреи није имала грациозно постојање, она и даље стоји као велика прекретница у људским достигнућима.

Повезан: Како се користи гласовно куцање у програму Мицрософт Ворд

1962: ИБМ -ова Схоебок

Деценију након Аудреи, ИБМ се окушао у развоју система за препознавање гласа. На Светском сајму 1962. године ИБМ је показао систем за препознавање гласа под именом Сховбок. Као и Аудреи, њен главни посао је било разумевање цифара 0-9, али је могло да разуме и шест речи: плус, минус, лажно, укупно, међузбир и искључено.

Схоебок је била математичка машина која је могла да реши једноставне аритметичке проблеме. Што се тиче повратних информација, уместо светла, Схоебок је успео да одштампа резултате на папиру. Ово га је учинило корисним као калкулатор, иако би звучник ипак морао да направи паузу између сваког броја/речи.

1971: ИБМ -ова аутоматска идентификација позива

Након Аудреи и Схоебок -а, друге лабораторије широм света развиле су технологију препознавања гласа. Међутим, то је почело тек 1970-их, када је 1971. године ИБМ избацио на тржиште први изум своје врсте. Назван је систем за аутоматску идентификацију позива. То је био први систем за препознавање гласа који се користио преко телефонског система.

Инжењери би звали и били повезани са рачунаром у Ралеигх -у, Северна Каролина. Позивалац би тада изговорио једну од 5.000 речи у свом речнику и добио "говорни" одговор као одговор.

Повезан: Како се користи гласовно диктирање на Мац рачунарима

1976: Харпија

Почетком 1970 -их, Министарство одбране САД -а заинтересовало се за препознавање гласа. ДАРПА (Агенција за напредне одбрамбене истраживачке пројекте) развила је програм Спеецх Ундерстандинг Ресеарцх (СУР) 1971. године. Овај програм је обезбедио средства за неколико компанија и универзитета за помоћ истраживању и развоју за препознавање гласа.

1976. године, због СУР -а, Универзитет Царнегие Меллон развио је Харпи систем. Ово је био велики скок у технологији препознавања гласа. Системи до тог тренутка су могли да разумеју речи и бројеве, али Харпи је био јединствен по томе што је могао да разуме целе реченице.

Имао је речник од само 1.011 речи, што је према једној публикацији Б. Ловерре и Р. Редди, изједначено са више од трилион различитих могућих реченица. Публикација затим наводи да је Харпи могао да разуме речи са 93,77% тачности.

Осамдесете су биле кључно време за технологију препознавања гласа, јер је ово деценија у којој је глас технологију препознавања, јер је ово била деценија у којој смо се упознали са Скривеном Марковљевом методом (ХММ). Главна покретачка снага ХММ -а је вероватноћа.

Кад год систем региструје фонем (најмањи елемент говора), постоји извесна вероватноћа шта ће бити следећи. ХММ користи ове вероватноће да одреди који ће фонем највероватније доћи следећи и формирати највероватније речи. Већина данашњих система за препознавање гласа и даље користи ХММ за разумевање говора.

Деведесете: Препознавање гласа стиже до потрошачког тржишта

Од стварања технологије препознавања гласа, било је на путу да пронађе простор на тржишту потрошача. Осамдесетих година прошлог века ИБМ је представио прототип рачунара који може да диктира говор у текст. Међутим, тек почетком деведесетих људи су почели да виде овакве апликације у својим домовима.

Године 1990. Драгон Системс је представио први софтвер за диктирање говора у текст. Звао се Драгон Дицтате и првобитно је објављен за Виндовс. Овај програм од 9.000 долара био је револуционаран за увођење масе у технологију препознавања гласа, али постојала је једна мана. Софтвер који се користи дискретни диктат, што значи да корисник мора да направи паузу између сваке речи да би их програм покупио.

Године 1996. ИБМ је поново допринео индустрији са Медспеаком. Ово је такође био програм за диктирање говора у текст, али није трпео дискретну дикацију као Драгон Дицтате. Уместо тога, овај програм би могао да диктира континуирани говор, што га је учинило убедљивијим производом.

Повезан: Како користити Гоогле помоћник са слушалицама

2010: Девојка по имену Сири

Током 2000 -их, технологија препознавања гласа постала је све популарнија. Имплементирано је у више софтвера и хардвера него икада раније, а један кључни корак у еволуцији препознавања гласа била је Сири, дигитални асистент. Године 2010. компанија под именом Сири представила је виртуелног асистента као иОС апликацију.

У то време, Сири је био импресиван софтвер који је могао да диктира шта говорник говори и да даје образован и духовит одговор. Овај програм је био толико импресиван да је Аппле исте године купио компанију и Сири мало поправио, гурајући је према дигиталном асистенту који познајемо данас.

Преко Аппле -а Сири је добила свој култни глас (глас Сусан Бенетт) и мноштво нових функција. Користи обрада природног језика да контролише већину функција система.

2010 -их: Велика 4 дигитална помоћника

Како сада стоји, четири велика дигитална помоћника доминирају препознавањем гласа и додатним софтвером.

  • Сири је присутан у скоро свим Апплеовим производима: иПхоне, иПод, иПад и Мац рачунарима.
  • Гоогле помоћник присутна је на већини од 3 милијарде + Андроид уређаја на тржишту. Осим тога, корисници могу користити команде у многим Гоогле услугама, попут Гоогле Хоме -а.
  • Амазон Алека нема много наменске платформе на којој живи, али је и даље истакнути асистент. Доступно је за преузимање и употребу на Андроид уређајима, Аппле уређајима. па чак и изабрати Леново преносне рачунаре
  • Бикби је најновији унос на листу дигиталних помоћника. То је Самсунгов домаћи дигитални помоћник и присутан је међу телефонима и таблетима компаније.

Говорена историја

Препознавање гласа је прешло дуг пут од времена Одри. Остварио је велике добитке на више поља; на пример, према Цлеар Бридге Мобиле, медицинска област имала је користи од гласовних цхатботова током пандемије 2020. Од само способности разумевања бројева до разумевања различитих варијација пуних реченица, препознавање гласа се показало као једна од најкориснијих технологија нашег модерног доба.

ОбјавиТвеетЕмаил
Како функционише препознавање гласа?

Све време користимо препознавање гласа, али како то функционише?

Прочитајте следеће

Повезане теме
  • Објашњена технологија
  • Сири
  • Гоогле помоћник
  • Алека
  • Бикби
  • Гласовне команде
О аутору
Артхур Бровн (Објављен 31 чланак)

Артхур је технолошки новинар и музичар који живи у Америци. У индустрији је скоро деценију, писао је за онлајн публикације попут Андроид Хеадлинес. Има дубоко знање о Андроиду и ЦхромеОС -у. Уз писање информативних чланака, вешт је и у извештавању о технолошким вестима.

Више од Артура Брауна

Претплатите се на наш билтен

Придружите се нашем билтену за техничке савете, критике, бесплатне е -књиге и ексклузивне понуде!

Кликните овде да бисте се претплатили