Веб-претраживач — разлика између измена

Садржај обрисан Садржај додат
м pravopis; козметичке измене
Ред 7:
Веб се састоји од површинског и дубинског (такође скривени или невидљиви веб). Свака страница на површинском вебу има логичну адресу која се назива [[веб адреса]] ({{јез-енгл|Uniforme Resource Locator - URL}}). Веб адреса странице омогућава њено директно учитавање. Супротно томе, дубински веб садржи странице које није могуће директно учитати као и записе у базама података који су складиштени у системима база података. Сматра се да је дубински веб 100 пута већи од површинског.<ref name="Bergman" />
 
Алатке које се користе за проналажење информација на вебу зову се претраживачи. Вјерује се да је више од милион претраживача оперативно на вебу. Претраживаче је могуће класификовати на основу типа података које претражују. Претраживачи који претражују текстуалне документе зовемо претраживачи докумената, док претраживаче који претражују структурисане податке који се чувају у [[база података|базама података]] зовемо претраживачи база података. Многи популарни претраживачи као што су Google и Yahoo су претраживачи докумената, док се многи претраживачи е-трговина као што је Amazon.com, сматрају претраживачима база података. Интегрисани претраживач Википедије је такође примјер претраживача базе података. Претраживачи докумената обично имају простији интерфејс са текстуалним пољем гдје корисници уносе свој упит који обично чине кључне ријечи које одражавају потребе корисника за одређеним информацијама. С друге стране, многи претраживачи база података омогућавају корисницима да врше специфичне и сложеније упите. Постоје и претраживачи који су специјализовани за претрагу [[мултимедија|мултимедијалних]]лних [[датотека]] (аудио и видео записа и слика).
 
Већина претраживача покривају само мали дио веба. Да би се повећала покривеност једног система претраге, могуће је комбиновати више претраживача одједном. Системи за претрагу који користе друге претраживаче за обављање претраге и комбинују их са својим резултатима, називају се метапретраживачи.
Ред 39:
=== Ефективност и ефикасност претраге ===
 
За страницу се каже да је ''релевантна'', уколико корисник који је извршио упит налази да је корисна. За задати упит корисника на фиксни скуп страница, скуп оних које су релевантне је такође фиксан. Добар систем претраге треба кориснику да врати висок степен релевантних страница као и да их рангује високо у повратним резултатима. Традиционално, ефективност система претраге се мјери преко два количника позната као одзив и прецизност. Код упита у скуп докумената x, одзив је проценат релевантних докумената који се на упит одзивају, а прецизност је проценат одзваних докумената који су за упит релевантни. Да би се оцјенила ефективност једног система претраге, врше се пробе низом упита. За сваки посебан упит, скуп релевантних докумената се идентификује унапријед. Код сваког пробног упита тражи се вриједност прецизности за сваку тачку одзива понаособ. Када се направи једна просјечна вриједност прецизности за сваку тачку одзива, онда се добије крива укупне просјечне прецизности система претраге која служи као мјера његове ефективности. Један систем претраге се сматра ефективнијим од другог, уколико је његова крива прецизности и одзива изнад криве другог. Код савршеног система претраге вриједности одзива и прецизности треба да буду једнаке броју 1. Другим ријечима, такав систем проналази тачан скуп релевантних докумената за сваки упит. У пракси, савршен учинак није остварљив из много разлога. На примјер, потребе корисника за одређеним информацијама обично не могу бити прецизно дефинисане пробним упитом, али ни самнисам садржај у документима, као ни у упитима, се не може у потпуности представити пондерисаним појмовима.
 
Употреба одзива и прецизности за мјерење ефективности традиционалног система претраге текста, захтијева да је унапријед познат број свих релевантних докумената за сваки пробни упит. Међутим, ово није практично за оцјењивање и независно вредновање великих претраживача, будући да је немогуће знати број релевантних страница за сваки упит у претраживачу, уколико се све оне ручно не прегледају. Без познавања броја релевантних страница за сваки пробни упит, мјера одзива се не може израчунати. Као резултат овог практичног ограничења, претраживачи се често оцјењују на основу средње прецизности која се изачунава на основу најрелевантнијих одзваних страница ''к'' за скуп пробних упита за неки мали [[цијели број]] —рецимо 20, или на основу просјечне позиције прве релевантне странице која је повратни резултат у сваком појединачном пробном упиту.<ref name = "Hawikng at al">D. Hawking, N. Craswell, P. Bailey, and K. Griffiths. [http://www.springerlink.com/content/q46m024612045366/ Measuring search engine quality]. ''Journal Information Retrieval'', '''4''' (1): 33–59, 2001.</ref>