Korpusna lingvistika — разлика између измена

Садржај обрисан Садржај додат
Нема описа измене
Ред 1:
{{Lingvistika-lat}}
'''Korpusna lingvistika''' je naziv za metod u lingvističkim istraživanjima u kome se koriste veliki uzorci prirodnog govora (korpusi). Korpusi se sastoje od više stotina hiljada (ili nekoliko miliona ili više) reči i njih je moguće automatski pretraživati. Analizom korpusa donose se pouzdani zaključci o frekvenciji upotrebe reči i izraza, kontekstu upotrebe konstrukcija koje želimo da proučimo, o različitim značenjima jedne reči, odlikama žanrova itd<ref>Taylor, C. (2008). What is corpus linguistics? What the data says, ''ICAME Journal 32'':179–200.</ref>. Korpusi se dele na: opšte korpuse, koji se sastoje od tekstova svih žanrova, i specijalizovane korpuse, koji se fokusiraju na uzorke jezika iz jedne epohe ili određene grupe govornika (npr. korpus jezika dece).
'''Korpusna lingvistika''' je dinamična oblast [[lingvistika|lingvistike]] koja se razvija velikom brzinom u savremenom dobu.
 
== Primena korpusa u leksikografiji ==
== Istorijat ==
Pošto daju pristup velikim uzorcima spontano upotrebljenog jezika, korpusi su danas neizbežan izvor podataka prilikom izrade rečnika. Veliki broj primera upotrebe koji su dostupni u elektronskoj formi ne samo da olakšava izradu, dopunjavanje i osavremenjivanje rečnika, već uvečava tačnost i preciznost informacija u rečniku. Opšti korpusi (koji sadrže više desetina ili stotina miliona reči) daju nam uvid u upotrebu i učestalost korišćenja reči, što je posebno važno za opis manje frekventnih reči. Uz to, mnogi korpusi sadrže i informacije poput mesta i vremena gde je tekst nastao, pola osobe koja je autor teksta, žanra kome tekst pripada i slične podatke koji mogu biti od koristi leksikografima. Korpusi koji se stalno dopunjavaju (engl. ''monitor corpora'') daju uvid i u nove reči i izraze i tačne načine na koje ih govornici upotrebljavaju<ref>McEnery, T. and Wilson, A. (2001).''Corpus Linguistics.''Edinburgh University Press.</ref>.
Začeci korpusne lingvistike javljaju se u vidu popisivanja višestrukih upotreba reči i izraza u tekstovima. U početku su ovi poslovi bili vezani za popisivanje svih reči iz [[Biblija|Biblije]] i mesta u tekstu gde su se te reči javile, odakle potiče izraz ''konkordansa''. Prve takve konkordanse Biblije datiraju iz XIII veka i na njima je po pravilu radio veliki broj monaha koji su indekse reči iz Biblije pravili ručno. Osim Biblije, na isti način su indeksirana i dela pisaca poput [[Šekspir]]a radi lakšeg proučavanje njihovih opusa; primer takve konkordanse je ''A Concordance to Shakespeare'' Endrua Beketa iz 1787. godine<ref name=":0">O’Keeffe, A., & McCarthy, M. (eds.). (2010). ''The Routledge Handbook of Corpus Linguistics.'' Abingdon: Routledge.</ref>.
 
== Primena korpusa u sintaksičkim istraživanjima ==
U izučavanju sintakse, korpusi omogućavaju da se težište u istraživanjima stavi na kvantitativnu umesto kvalitativne analize. Umesto subjektivnih procena prihvatljivosti ili učestalosti određenih sintaktičkih konstrukcija, korpusi daju empirijski uvid u najtipičnije upotrebe i varijacije do kojih dolazi u odnosu na jezički varijetet, žanr i slične varijable<ref>McEnery, T. and Wilson, A. (2001).''Corpus Linguistics.''Edinburgh University Press.</ref>.
 
== Istorijat korpusne lingvistike ==
Začeci korpusne lingvistike javljajubila se u vidusu popisivanja višestrukih upotreba reči i izraza u tekstovima. U početku su ovi poslovi bili vezani za popisivanje svih reči iz [[Biblija|Biblije]] i mesta u tekstu gde su se te reči javile, odakle potiče izraz ''konkordansa''. Prve takve konkordanse Biblije datiraju iz XIII veka i na njima je po pravilu radio veliki broj monaha koji su indekse reči iz Biblije pravili ručno. Osim Biblije, na isti način su indeksirana i dela pisaca poput [[Šekspir]]a radi lakšeg proučavanje njihovih opusa; primer takve konkordanse je ''A Concordance to Shakespeare'' Endrua Beketa iz 1787. godine<ref name=":0">O’Keeffe, A., & McCarthy, M. (eds.). (2010). ''The Routledge Handbook of Corpus Linguistics.'' Abingdon: Routledge.</ref>.
 
[[Исусовци|Jezuita]] [[Roberto Busa]] pedesetih godina XX veka započeo ''Index Thomisticus'', indeks svih dela [[Тома Аквински|Tome Akvinskog]], koji je kasnije prenesen na bušene kartice i predstavlja prvi korpus koji se mogao kompjuterski pretraživati i konkordansirati<ref>McEnery, T. and Wilson, A. (2001).''Corpus Linguistics.''Edinburgh University Press.</ref><ref name=":0" />.