Кад човек погледа сцену или слику, разуме их - који се предмети налазе у њој и шта се дешава ако се дешава нека радња. С друге стране, рачунар обрађује само дигиталне податке који описују вредност боје сваког пиксела. За човека је препознавање пице на претрпаном столу без напора. Али до недавно рачунари нису могли да извршавају исти задатак.
Компјутерски вид или ЦВ омогућава рачунару да може да одабере важне информације из визуелних улаза и да на основу тих података даје тачна предвиђања и препоруке.
Како функционише Цомпутер Висион?
Пре рачунарског вида, да би се створио програм који препознаје одређену слику, особа би морала да ради сате ручног рада ногу. Прво, база података сличних слика морала би да се упореди.
Затим би ове слике требало ручно анализирати, измерити и означити релевантним подацима да би истраживач могао да идентификује предметни предмет (попут боје, мерења и облик). Тек тада се софтвер могао користити за предвиђање.
С друге стране, рачунарски вид аутоматизује читав овај процес користећи приступ машинском учењу познат као дубоко учење.
Дубинско учење користи вишеслојну неуронску мрежу са стотинама потенцијалних слојева. У случају слика, ово је обично конволуциона неуронска мрежа (ЦНН).Детаљно објашњење како функционишу дубоко учење и неуронске мреже далеко је изван оквира овог чланка. У основи се велике количине података уносе у неуронску мрежу. Неуронска мрежа непрекидно анализира податке све док не може да створи тачне прогнозе о њима.
У случају ЦНН-а који се користи за задатак рачунарског вида, неуронска мрежа узима податке у неколико корака. Прво, скупља слику у неколико делова (појединачни пиксели или групе пиксела који су претходно означени).
Затим прави предвиђања о томе шта се налази на различитим деловима слике (попут тврдих ивица или одређених предмета). Непрестано проверава тачност ових предвиђања и сваки пут благо мења делове алгоритма док не постане врло тачан.
Рачунари су сада толико моћни да могу много брже да анализирају слику од људског мозга, посебно када су научили да препознају одређене обрасце. На тај начин је лако видети како алгоритам дубоког учења може надмашити људске могућности.
Које су врсте рачунарског вида?
Компјутерски вид укључује анализу и разумевање слика и излаз релевантних предвиђања или одлука о сликама. Постоје разни задаци које ће рачунарски вид користити за постизање ових циљева. Неки од њих укључују:
- Класификација слика: Тип слике је препознат. На пример, било да је реч о лицу, пејзажу или предмету особе. Овакав задатак се може користити за брзу идентификацију и класификацију слика. Једна од употреба за то је аутоматско препознавање и блокирање непримереног садржаја на друштвеним мрежама.
- Препознавање предмета: Слично класификацији слика, препознавање објеката може идентификовати одређени објекат унутар сцене - попут пице на претрпаном столу.
- Детекција ивице: Уобичајена употреба рачунарског вида и обично први корак у откривању предмета је идентификовање тврдих ивица на слици.
- Идентификација објекта: Ово је препознавање појединачних примера предмета или слике, попут идентификовања одређене особе, отисака прстију или возила.
- Откривање предмета: Откривање је идентификација одређене особине на слици, попут сломљене кости на рендгену.
- Сегментација објеката: Ово је идентификација пиксела на слици који припадају предметном предмету.
- Праћење објеката: У видео секвенци, након што је објекат препознат, лако се може пратити кроз видео запис.
- Обнављање слике: Замућење, шум и други артефакти на слици могу се уклонити тачним утврђивањем места на којој се налази објекат у односу на позадину.
Примери рачунарске визије
Вештачка интелигенција је већ се користи у неколико индустрија са запањујућим ефектом, што важи за рачунарски вид. Ево неколико примера ЦВ који се већ користе данас.
Препознавање лица
Препознавање лица један је од главних начина на који се рачунарски вид данас користи. У поређењу са базама података познатих лица, алгоритми рачунарског вида могу врло прецизно идентификовати поједине људе.
- Друштвени медији анализирају слике и аутоматски означавају кориснике за које имају добар избор слика.
- Преносна рачунала, телефони и сигурносни уређаји могу идентификовати људе да би им дозволили приступ.
- Органи реда користе препознавање лица у ЦЦТВ системима за идентификовање осумњичених.
Лек
Компјутерски вид се тренутно користи у здравству за пружање бржих и тачнијих дијагноза него што стручњаци могу да поставе. Многе примене укључују анализу рендгенских, ЦТ или МРИ слика за одређена стања, укључујући неуролошке болести, туморе и сломљене или сломљене кости.
Самовозећи аутомобили
Аутономна возила морају да разумеју своје окружење да безбедно вози. То значи препознавање путева, трака, саобраћајне сигнализације, других возила, пешака и још много тога. Сви ови задаци користе системе рачунарског вида у реалном времену како би се избегли судари и безбедна вожња.
Рачунарска визија је изазовна
Тренутне примене рачунарског вида већ почињу да мењају начин на који радимо у разним индустријама. Од могућности откривања неисправне или покварене опреме до тачне дијагнозе рака, рачунарски вид има способност да побољша системе и спаси животе.
Али, није без изазова. Компјутерски вид је још увек далеко од онога што је људски вид. Имамо хиљаде година еволуције која нам омогућава да препознамо и разумемо готово све што се око нас дешава у реалном времену. Али, немамо појма како људски мозак обавља ове задатке.
Дубинско учење је огроман корак у правом смеру, али ипак захтева невероватну количину посла створити систем који може да изврши задатак који људи могу врло лако да изврше, попут идентификовања аутомобила на пут. То је зато што рачунари врло ефикасно обављају ограничене задатке. Развој рачунара који може да разуме укупну сложеност визуелног света је потпуно другачија игра са лоптом.
Како се више истраживања буде бавило апликацијама АИ и биологијом човека, вероватно ћемо у блиској будућности видети експлозију могућих употреба рачунарског вида.
Алгоритми машинског учења дизајнирани су да олакшају живот и побољшају системе, али могу поћи по злу са лошим последицама.
Прочитајте следеће
- Објашњена технологија
- Програмирање
- Вештачка интелигенција
- Неуронске мреже

Јаке Харфиелд је слободни писац из Перта у Аустралији. Кад не пише, обично је вани у жбуњу фотографишући локалне дивље животиње. Можете га посетити на ввв.јакехарфиелд.цом
Претплатите се на наш билтен
Придружите се нашем билтену за техничке савете, прегледе, бесплатне е-књиге и ексклузивне понуде!
Још један корак…!
Молимо потврдите своју адресу е-поште у е-поруци коју смо вам управо послали.