Korpusna lingvistika — разлика између измена

Садржај обрисан Садржај додат
м Dcirovic је преместио страницу Istorijat korpusne lingvistike на Korpusna lingvistika
.
Ред 1:
{{Lingvistika-lat}}
{{почетник|17|11|2016}}
[['''Korpusna lingvistika]]''' je dinamična oblast [[lingvistika|lingvistike]] koja se razvija velikom brzinom u savremenom dobu. U ovom članku biće ukratko prikazan istorijski razvoj korpusne lingvistike i njenih metoda.
 
== Istorijat ==
Začeci korpusne lingvistike javljaju se u vidu popisivanja višestrukih upotreba reči i izraza u tekstovima. U početku su ovi poslovi bili vezani za popisivanje svih reči iz [[Biblija|Biblije]] i mesta u tekstu gde su se te reči javile, odakle potiče izraz ''konkordansa''. Prve takve konkordanse Biblije datiraju iz XIII veka i na njima je po pravilu radio veliki broj monaha koji su indekse reči iz Biblije pravili ručno. Osim Biblije, na isti način su indeksirana i dela pisaca poput Šekspira[[Šekspir]]a radi lakšeg proučavanje njihovih opusa; primer takve konkordanse je ''A Concordance to Shakespeare'' Endrua Beketa iz 1787. godine<ref name=":0">O’Keeffe, A., & McCarthy, M. (eds.). (2010). ''The Routledge Handbook of Corpus Linguistics.'' Abingdon: Routledge.</ref>.
 
[[Исусовци|Jezuita]] [[Roberto Busa]] pedesetih godina XX veka započeo ''Index Thomisticus'', indeks svih dela [[Тома Аквински|Tome Akvinskog]], koji je kasnije prenesen na bušene kartice i predstavlja prvi korpus koji se mogao kompjuterski pretraživati i konkordansirati<ref>McEnery, T. and Wilson, A. (2001).''Corpus Linguistics.''Edinburgh University Press.</ref><ref name=":0" />.
 
Veoma važan bio je rad leksikografa, koji su rečnike izrađivali na osnovu primera stvarne upotrebe jezika. Rad dr Semjuela Džonsona na rečniku engleskog jezika iz 1755. godine oslanjao se na ogroman korpus sastavljen od papirnih traka sa primerima upotrebe reči zabeleženih između 1560. i 1660. godine. [[Oksfordov rečnik engleskog jezika]] (''Oxford English Dictionary'') izrađen je na isti način uz pomoć više od tri miliona papirnih traka<ref name=":0" />.
 
Ova metoda korišćena je i za potrebe izrade [[gramatika]]. Među takvim primerima su višetomna gramatika Ota Jespersena ''A Modern English Grammar on Historical Principles'' (1909–1949), kao i korpus ''Survey of English Usage (SEU) Corpus'' na osnovu kojeg je izrađena gramatika ''A Comprehensive Grammar of the English Languag''e<ref name=":1">Kennedy, G. (1998). ''An Introduction to Corpus Linguistics.'' London: Adison Wesley Longman.</ref><ref>Meyer, C. F. (2004). ''English Corpus Linguistics: An Introduction.'' Cambridge: Cambridge University Press.</ref>.
 
Još jedan doprinos razvoju pretraživih zbirki dali su bibliotekari. Sedamdesetih godina XX veka bibliotekari su osmislili neke sisteme za pretraživanje ključnih reči u kontekstu radi lakše izrade bibliotečkih kataloga, [[bibliografija]] i sl<ref name=":0" />.
 
Američki lingvisti strukturalisti zagovarali su korišćenje i proučavanje autentičnih primera jezika u spontanoj upotrebi<ref name=":0" />. Zbirke uzoraka teksta bile su neizostavne u istorijskoj lingvistici, gde nije bilo moguće doći do izvornih govornika, recimo srednjevekovnog engleskog jezika. Zatim, fonetičari i lingvisti koji proučavaju usvajanje jezika kod dece počeli su da koriste korpuse. U usvajanju jezika su tokom šezdesetih godina XX veka već korišćeni transkribovani primeri upotrebe jezika u govoru dece (CHILDES)<ref name=":0" />.
Линија 16 ⟶ 17:
Korpusna lingvistika je na kratko oslabljena širenjem postavki transformaciono-generativne gramatike Noama Čomskog. Zbog naglaska na jezičkoj kompetenciji (jezičkoj intuiciji govornika), a ne na performansi (stvarnoj upotrebi jezika), korpusne metode su bile zanemarene u proučavanju jezika od kraja pedesetih do osamdesetih godina XX veka. Ipak, korpusna lingvistika nije nestala i šezdesete i sedamdesete godine XX. veka donele su neke prekretnice u razvoju ove oblasti.
 
Prvi elektronski korpus pisanog jezika, ''the Brown Corpus, sastavili su š''ezdesetih godina XX veka Nelson Frensis i Henri Kučera. Ovaj korpus je prvo zapisan na [[Бушена картица|bušenim karticama]], a kasnije je prenesen na magnetne trake<ref name=":0" /><ref name=":1" />. T''he Brown Corpus se'' sastojao od oko milion reči iz tekstova na engleskom jeziku sa američkog govornog područja. Materijal je prikupljen tokom 1961. godine iz petnaest različitih jezičkih žanrova i bio je sastavljen specijalno za potrebe lingvističke analize. Ovaj korpus je postavio prve standarde u izradi opštih korpusa i poslužio je kao model za sastavljanje drugih korpusa. Po ugledu na njega nastao je britanski pandan ''Lancaster-Oslo/Bergen Corpus (LOB)''<ref name=":1" />.
 
Prvi korpus govornog engleskog jezika izrađen je na [[Univerzitet u Edinburgu|Univerzitetu u Edinburgu]] je između 1963. i 1965. godine. Sastojao se od 166.000 reči<ref name=":0" />. Između 1975. i 1990. izrađen je korpus govornog engleskog jezika ''the London-Lund Corpus of Spoken English (LLC)'' koji je sadržao pola miliona reči.
 
Tokom [[1970e|sedamdesetih]] godina XX veka postepeno se umnožavao broj elektronskih korpusa. Pored engleskog, javljaju se i korpusi na drugim jezicima. Javljaju se i drugačije vrste jezičkih korpusa. Tokom osamdesetih i devedesetih godina XX veka korpusna lingvistika je doživela pravi procvat<ref name=":0" />.Razvoj korpusne lingvistike u ovom periodu omogućili su sve veća dostupnost kompjutera i napredak tehnologije u pogledu kapaciteta i brzine prikupljanja i obrade podataka.
 
== Reference ==
{{reflist}}
 
==Literatura==
{{refbegin|2}}
*[http://www.benjamins.com/cgi-bin/t_seriesview.cgi?series=SCL Studies in Corpus Linguistics] and [http://www.peterlang.com/Index.cfm?vSiteName=SearchSeriesResult.cfm&vSeriesID=ECL English Corpus Linguistics]
* Biber, D., Conrad, S., Reppen R. ''Corpus Linguistics, Investigating Language Structure and Use'', Cambridge: Cambridge UP, 1998. ISBN 0-521-49957-7
* McCarthy, D., and Sampson G. ''Corpus Linguistics: Readings in a Widening Discipline'', Continuum, 2005. ISBN 0-8264-8803-X
* Facchinetti, R. ''Theoretical Description and Practical Applications of Linguistic Corpora''. Verona: QuiEdit, 2007 ISBN 978-88-89480-37-3
* Facchinetti, R. (ed.) ''Corpus Linguistics 25 Years on''. New York/Amsterdam: Rodopi, 2007 ISBN 978-90-420-2195-2
* Facchinetti, R. and Rissanen M. (eds.) ''Corpus-based Studies of Diachronic English''. Bern: Peter Lang, 2006 ISBN 3-03910-851-4
* Lenders, W. ''Computational lexicography and corpus linguistics until ca. 1970/1980'', in: Gouws, R. H., Heid, U., Schweickard, W., Wiegand, H. E. (eds.) ''Dictionaries - An International Encyclopedia of Lexicography. Supplementary Volume: Recent Developments with Focus on Electronic and Computational Lexicography''. Berlin: De Gruyter Mouton, 2013 ISBN 978-3112146651
{{refend}}
 
== Spoljašnje veze ==
* [http://www.uow.edu.au/~dlee/CBLLinks.htm Bookmarks for Corpus-based Linguists – very comprehensive site with categorized and annotated links to language corpora, software, references, etc.]
* [http://torvald.aksis.uib.no/corpora/ Corpora discussion list]
* [http://corpus.byu.edu/ Freely-available, web-based corpora (100 million – 400 million words each): American (COCA, COHA), British (BNC), TIME, Spanish, Portuguese]
* [http://www.bmanuel.org/index.html Manuel Barbera's overview site]
* [http://ifa.amu.edu.pl/~kprzemek/biblios/corpling.zip Przemek Kaszubski's list of references]
* [http://www.askoxford.com/oec/mainpage/oec01/?view=uk AskOxford.com] ''the composition and use of the Oxford Corpus''
* [http://www.dmcbc.com.cn/ DMCBC.com]
 
[[Категорија:Примењена лингвистика]]