Екстракција информација — разлика између измена

Садржај обрисан Садржај додат
Autobot (разговор | доприноси)
м Робот: додато {{bez_izvora}}
м →‎top: попуњавање шаблон Чишћење using AWB
Ред 1:
{{bez_izvora}}
{{чишћење|разлог=|датум=}}
{{сређивање}}
У [[Генерисање природног језика|обради природног језика]], '''екстракција информација''' (-{''Information Extraction''}- – IE) је тип проналажења информација чији је циљ да аутоматски дође до структурираних информација, односно категорисаних и контекстуално и семантички добро дефинисаних података из одређене области, од неструктурираних машинских читљивих докумената. Пример овога је екстракција случајева спајања корпорација, формалније -{MergerBetween(company1,company2,date}-), из вести постављене на нет и то из реченице као што је: „Јуче, -{Foo Inc}-., који је базиран у [[Њујорк]]у, најавио је да ће преузети -{Bar Corp}-.“ Шири циљ ИЕ је да допусти да израчунавање буде извршено на претходно неструктурираним подацима. Специфични циљ би био допуштањ логичком размишљању да извуче закључке засноване на логичком садржају података. 
 
Ред 13:
-  МУЦ-3 (1991), МУЦ-4 (1992): Тероризам у латино-америчким земљама
 
-  МУЦ-5 (1993): Удружени ризични подухвати и микроелектронски домени
 
-  МУЦ-6 (1995): Вести о променама у управи
Ред 24:
-  Препознавање именских ентитета: препознавање имена људи и организација, назива места, временских израза и одређених типова нумеричких израза. Ови системи су креирани да користе, како лингвистичке граматички базиране технике (које захтевају месеце рада искусних лингвиста), тако и статистичке моделе.
 
-  Ко-референција: идентификовање ланаца именичких фраза које се односе на исти предмет. На пример, анафора је тип ко-референције. 
 
-  Терминолошка екстракција: проналажење релевантних термина за дати корпус.