Претраживачи попут Гоогле -а део су онога што интернет чини тако моћним. Уз неколико притисака на тастер и притиском на дугме, појављују се најрелевантнији одговори на ваше питање. Али да ли сте се икада запитали како функционишу претраживачи? Пописивачи веба су део одговора.
Дакле, шта је веб пописивач и како функционише?
Шта је веб претраживач?
Када тражите нешто у претраживачу, машина мора брзо скенирати милионе (или милијарде) веб страница да би приказала најрелевантније резултате. Пописивачи веба (познати и као пауци или роботи за претраживаче) су аутоматизовани програми који „претражују“ интернет и састављају информације о веб страницама на лако доступан начин.
Реч „пузање“ односи се на начин на који алати за индексирање Интернета прелазе интернетом. Пописивачи веба су познати и као „пауци“. Ово име потиче од начина на који пужу по мрежи - на пример како пауци пужу по њиховим пауковим мрежама.
Пописивачи веба процењују и састављају податке на што је могуће више веб страница. То чине како би подаци били лако доступни и претраживи, па су стога толико важни за претраживаче.
Замислите веб пописивача као уредника који саставља индекс на крају књиге. Посао индекса је да информише читаоца где се у књизи појављује свака кључна тема или израз. Слично, веб пописивач ствара индекс који претраживач користи за брзо проналажење релевантних информација о упиту за претрагу.
Шта је индексирање претраге?
Као што смо споменули, индексирање претраживања је упоредиво са састављањем индекса на полеђини књиге. На неки начин, индексирање претраживања је попут стварања поједностављене карте интернета. Када неко постави тражилици питање, претраживач га покреће кроз индекс, а најрелевантније странице се појављују прве.
Али, како претраживач зна које су странице релевантне?
Индексирање претраживања првенствено се фокусира на две ствари: текст на страници и метаподатке странице. Текст је све што видите као читач, док су метаподаци информације о уносу странице од стране креатора странице, познате као „мета ознаке“. Метаознаке укључују ствари попут описа странице и мета наслова које се појављују у претрази резултати.
Тражилице попут Гоогле -а индексират ће сав текст на веб страници (осим одређених ријечи попут "тхе" и "а" у неким случајевима). Затим, када се појам претражује у претраживачу, он ће брзо претражити његов индекс за најрелевантнију страницу.
Како ради веб претраживач?
Алат за индексирање веба ради како му име говори. Почињу на познатој веб страници или УРЛ -у и индексирају сваку страницу на тој УРЛ адреси (већину времена власници веб локација траже од претраживача да индексирају одређене УРЛ адресе). Док наилазе на хипервезе на тим страницама, саставиће листу „обавеза“ које ће следеће пописивати. Пописивач веба ће ово наставити неограничено, придржавајући се одређених правила о томе које странице треба пописивати, а које занемарити.
Пописивачи веба не претражују сваку страницу на Интернету. У ствари, процењује се да је само 40-70% интернета индексирано претрагом (што је и даље милијарде страница). Многи алати за индексирање веба дизајнирани су да се усредсреде на странице за које се сматра да су „ауторитативније“. Ауторитативан странице одговарају неколицини критеријума због којих је већа вероватноћа да садрже висококвалитетне или популарне информације. Пописивачи веба такође морају стално да посећују странице док се ажурирају, уклањају или премештају.
Последњи фактор који контролише странице које ће веб пописивач пописивати је протокол роботс.ткт или протокол за изузимање робота. На серверу веб странице налази се датотека роботс.ткт која поставља правила за било који алат за индексирање веба или друге програме који приступају страници. Датотека ће искључити могућност пописивања одређених страница и које везе алат за индексирање може да прати. Једна сврха датотеке роботс.ткт је да ограничи оптерећење које роботи постављају на сервер веб локације.
Да бисте спречили веб пописивач да приступи одређеним страницама на вашој веб локацији, можете додати ознаку „дисаллов“ путем роботс.ткт датотеку или додајте ноиндек мета ознака дотичне странице.
Која је разлика између пузања и стругања?
Стругање са веба је употреба робота за преузимање података са веб локације без дозволе те веб локације. Често се стругање са Интернета користи из злонамерних разлога. Веб стругање често преузима сав ХТМЛ код са одређених веб локација, а напреднији стругачи ће такође узети ЦСС и ЈаваСцрипт елементе. Алати за стругање Веба могу се користити за брзо и једноставно састављање информација о одређеним темама (рецимо, попис производа), али се такође могу и одлучити сиве и илегалне територије.
С друге стране, претраживање и индексирање веба је индексирање информација на веб локацијама уз дозволу тако да се оне могу лако појавити у претраживачима.
Примери веб пописивача
Сваки велики претраживач има једног или више пописивача веба. На пример:
- Гоогле има Гооглебот
- Бинг има Бингбот
- ДуцкДуцкГо има ДуцкДуцкБот.
Већи претраживачи попут Гоогле -а имају посебне ботове за различите фокусе, укључујући Гооглебот слике, Гооглебот видео записе и АдсБот.
Како веб индексирање утиче на СЕО?
Ако желите да се ваша страница појави у резултатима претраживача, страница мора бити доступна веб пописивачима. У зависности од сервера веб локације, можда ћете желети да доделите одређену учесталост индексирања, које странице ће пописивач скенирати и колики притисак могу да изврше на ваш сервер.
У основи, желите да се алати за индексирање веба усаврше на страницама испуњеним садржајем, али не и на страницама попут порука захвалности, страница администратора и интерних резултата претраживања.
Информације надохват руке
Коришћење претраживача постало је друга природа за већину нас, али већина нас нема појма како они функционишу. Пописивачи веба су један од главних делова ефикасног претраживача и свакодневно ефикасно индексирају информације о милионима важних веб локација. Они су непроцењив алат за власнике веб страница, посетиоце и претраживаче.
Можда мислите да програмери и веб програмери раде исти посао, али то је далеко од истине. Ево кључних разлика између програмера и веб програмера.
Прочитајте следеће
- Објашњена технологија
- Веб Сеарцх
- Гоогле претрага
- Претражите трикове
Јаке Харфиелд је слободни писац из Пертха, Аустралија. Кад не пише, обично излази у жбун и фотографише локалне дивље животиње. Можете га посетити на ввв.јакехарфиелд.цом
Претплатите се на наш билтен
Придружите се нашем билтену за техничке савете, критике, бесплатне е -књиге и ексклузивне понуде!
Кликните овде да бисте се претплатили