Упитнички системи — разлика између измена

Садржај обрисан Садржај додат
нови чланак ...
(нема разлике)

Верзија на датум 7. март 2007. у 20:15

Упитнички системи (системи: питање-одговор, енгл. Question answering) су врста претраживања информација. За дату колекцију докумената (као што је Интернет или локална колекција) систем треба да буде у стању да пронађе одговоре на питања постављена на природном језику. Упитнички системи се сматрају сложенијим техникама обраде природних језика од претраживања и проналажења информација, и некад се на њих гледа као на следећи корак иза претраживачких машина.

Истраживачи у овој области морају да се носе са великим опсегом питања као што су: чињенице, листе, дефиниције, питањима која почињу са како, зашто, питањима са семантичким ограничењима, итд. Колекције варирају од малих колекција до целог Интернета.

  • Упитнички системи затвореног домена одговарају на питања из специфичне области, на пример само на питања везана за кварове на аутомобилима. Изградња оваквог система може бити олакшана тиме што системи за обраду језика могу да користе мање количине знања које се најчешће организује у виду онтологије.
  • Упитнички системи отвореног типа одговарају на питања из свих области, ослањају се на опште онтологије и светско знање. С друге стране, ови системи најчешће користе веће базе знања у којима могу пронаћи одговор.


Архитектура

Први упитнички системи су развијени шездесетих година двадесетог века и били су пре свега интерфејс за експертске системе који је написан да би човек комуницирао са овим системом на природном језику. Насупрот томе, савремени упитнички системи користе текстуалне документе као скуп знања којим располажу.

Савремени упитнички системи најчешће садрже модул за класификацију питања који одређује тип питања и тип одговора. Након анализе питања, систем најчешће користи неколико модула који покушавају да смање количину текста у којој треба наћи одговор. Модул за проналажење докумената користи претраживачке машине да пронађе документе и параграфе у којима се може налазити одговор на питање. На крају систем покушава да конструише и сам одговор. На пример, ако је питање било „Када је умро Аристотел?“, тада систем треба да установи да се ради о питању чији одговор треба да буде одредница за време. Потом неколико модула треба да пронађе документе у којима се помиње Аристотелова смрт. Ово је компликован део, с обзиром на то да се експлицитан одговор не мора налазити у тексту. У тексту не мора писати „Аристотел је умро 322. године пне.“ већ може писати „Не зна се тачно када је Аристотел рођен, али је свакако он био један од највећих филозофа који су икада живели. Према неким подацима, умро је највероватније 322. године пне.“ Систем треба да препозна да се и друга реченица овог текста односи на Аристотела, као и да прпозна који део реченице садржи временску одредницу.