Веб-претраживач — разлика између измена

Садржај обрисан Садржај додат
м Враћене измене 89.216.182.216 (разговор) на последњу измену корисника Dcirovicbot
Ред 33:
Постоје многе методе за ранговање веб-страница за корисничке упите, а различити претраживачи их различито користе. На примјер, неке методе ранговања могу узети у обзир близину појмова који су предмет упита у некој страници. Као други примјер, претраживач може сачувати информације о броју приступа различитих корисника одређеној страници и искористити те информације за ранговање веб-страница које ће се приказати поводом будућих упита. На вебу постоји много популарних претраживача, али Гугл је сматран једним од најпопуларнијих. Главни разлог за то је његова метода ранговања страница која има способност да разлликује најважније странице од мање важних чак и када се у свима њима исти број пута појављују појмови који су предмет упита. За одлучивање о значају сваке стрнице, Гугл користи информације о линковању међу њима, односно начин на који линкују једне на друге. Тако линк са странице A на страницу Б а који је поставио аутор странице A, служи као индикација да аутор странице A сматра да страница Б има неку вриједност. На читавом вебу, на страницу Б може линковати већи број других страница и ти линкови могу послужити за одлучивање о њеној свеукупној вриједности или значају. За дату страницу, ''PageRank'' је мјера њеног релативног значаја на вебу, и он се израчунава на бази информација о линковању.<ref name="Page at al">L. Page, S. Brin, R. Motwani, and T. Winograd. ''The PageRank Citation Ranking: Bring Order to the Web''. Technical Report, Stanford University, 1998.</ref> Три главне идеје стоје иза дефинисања значаја и израчунавања PageRank-a: (1) Странице које су линковане са више страница су највејероватније најважније. Другим ријечима, значај странице треба да се успостави на основу њене популарности међу ауторима свих других веб-страница. (2) Странице које су линковане са најзначајнијих веб-страница највјероватније и саме имају посебан значај. (3) Странице које имају линкове на више страница имају мање утицаја на значај сваке линковане странице појединачно. Другим ријечима, ако страница има више подстраница, онда она једино може пренијети мањи дио свог значаја на сваку од њих. На основу ових схватања Гуглови оснивачи су развили метод за израчунавање значаја (PageRank) сваке странице на вебу.<ref name="Page at al" /> PageRank веб-странице се може комбиновати са другим мјерама на бази садржаја за индикацију њеног свеукупног значаја у односу на дати упит. На примјер, за задати упит x, страница може бити рангована на основу пондерисаног збира њених сличности са упитом и њеног PageRank-а. Међу страницама са великим сличностима, овај метод ће дати предност онима које имају виши PageRank.
 
=== Ефективност и ефикасност претраге kurca bakinog ===
За страницу се каже да је ''релевантна'', уколико корисник који је извршио упит налази да је корисна. За задати упит корисника на фиксни скуп страница, скуп оних које су релевантне је такође фиксан. Добар систем претраге треба кориснику да врати висок степен релевантних страница као и да их рангује високо у повратним резултатима. Традиционално, ефективност система претраге се мјери преко два количника позната као одзив и прецизност. Код упита у скуп докумената x, одзив је проценат релевантних докумената који се на упит одзивају, а прецизност је проценат одзваних докумената који су за упит релевантни. Да би се оцјенила ефективност једног система претраге, врше се пробе низом упита. За сваки посебан упит, скуп релевантних докумената се идентификује унапријед. Код сваког пробног упита тражи се вриједност прецизности за сваку тачку одзива понаособ. Када се направи једна просјечна вриједност прецизности за сваку тачку одзива, онда се добије крива укупне просјечне прецизности система претраге која служи као мјера његове ефективности. Један систем претраге се сматра ефективнијим од другог, уколико је његова крива прецизности и одзива изнад криве другог. Код савршеног система претраге вриједности одзива и прецизности треба да буду једнаке броју 1. Другим ријечима, такав систем проналази тачан скуп релевантних докумената за сваки упит. У пракси, савршен учинак није остварљив из много разлога. На примјер, потребе корисника за одређеним информацијама обично не могу бити прецизно дефинисане пробним упитом, али нисам садржај у документима, као ни у упитима, се не може у потпуности представити пондерисаним појмовима.