Gornjolužičkosrpski tekstualni korpus

Gornjolužičkosrpski tekstualni korpus (glsrp. HOrnjoserbski Tekstowy KOrpus; skrać. HoTKo)[1] digitalni je tekstualni korpus gornjolužičkosrpskog jezika.

Gornjolužičkosrpski tekstualni korpus
Rezultati pregleda na sajtu kontext.korpus.cz (2019)
Veb-adresakontext.korpus.cz
Komercijalnostne
Dostupan nagornjolužičkosrpski
VlasnikKarlov univerzitet
Pokrenut2001

Istorija uredi

Istorija gornjolužičkosrpskog tekstualnog korpusa je povezana sa projektom Lužičkosrpskog instituta za stvaranje elektronskog jednojezičnog gornjolužičkosrpskog rečnika u prvoj polovini 1990-ih godina. Međutim, ovaj projekat nije realizovan. Godine 1996, počeo je rad na stvaranju elektronskog gornjolužičkosrpskog tekstualnog korpusa. Osnivač korpusa bio je radnik Lužičkosrpskog instituta Edvard Vornar. Nakon što se 2003. godine Vornar preselio u Lajpcig, odgovornost je prešla na rukovodioca Lužičkosrpke centralne biblioteke Franca Šena.[2] Godine 2001, korpus je počeo da radi na sajtu Lužičkosrpskog instituta. Onda je bio dvojezičan — lužičkosrpsko-engleski.[3] U odabiranju aktuelnih tekstova (knjiga, novina i časopisa) učestvovali su Narodno izdavačko preduzeće „Domovina” u Baucenu i Jezički centar WITAJ. Većina tekstova je skenirana od strane naučno-tehničkog personala Lužičkosrpskog instituta.[4] Gornjolužičkosrpski tekstualni korpus radi u saradnji sa Institutom češkog nacionalnog korpusa na Filozofskom fakultetu Karlovog univerziteta u Pragu.[1]

Sadržaj korpusa uredi

Mali deo tekstova korpusa, koji se uglavnom odnose na 19. vek, čuva istorijsku orfografiju. Tako, na primer, umesto savremenog š koristi se istorijsko sch, umesto savremenih ć/čcź/cž, umesto savremenih s/zß/s. Tekstovi 20. veka do 1945. godine koriste kh za savremeno h na početku morfema i meke ŕ.[5]

Većina tekstova je publicistika (57%), zatim — beletristika (23%), verski tekstovi (4%), naučni tekstovi (4%), rečnici i knjige za terminologiju za pojedine školske predmete (12%). Najstariji tekstovi pripadaju prvoj polovini 19. veka (dela H. Zejlera i R. Menja, brojevi „Časopisa Matice lužičkosrpske” od 1848. godine), najnoviji tekstovi su novine „Serbske novini[5] i časopis Katolski Posoł. Већина текстова односи на период након 1989/1990. година (54%). Текстови 19. века чине 10% корпуса, прве половине 20. века до 1945. године — 18%, за период између 1945. и 1990. година — 19%.[6] Резултати претраге према корпусу дају информације о извору (аутору, наслову, месту и времену публикације).[1]

Референце uredi

  1. ^ а б в Wölkowa, Sonja (2014). „Tekstowy korpus a dalše informaciske srědki wo hornjoserbskej rěči w interneće”. Studia z Filologii Polskiej i Słowiańskiej. Warszawa: Instytut Slawistyki, Polskiej Akademii Nauk (49): 65. 
  2. ^ Wölkowa, Sonja (2014). „Tekstowy korpus a dalše informaciske srědki wo hornjoserbskej rěči w interneće”. Studia z Filologii Polskiej i Słowiańskiej. Warszawa: Instytut Slawistyki, Polskiej Akademii Nauk (49): 60. 
  3. ^ Wölkowa, Sonja (2014). „Tekstowy korpus a dalše informaciske srědki wo hornjoserbskej rěči w interneće”. Studia z Filologii Polskiej i Słowiańskiej. Warszawa: Instytut Slawistyki, Polskiej Akademii Nauk (49): 61. 
  4. ^ Wölkowa, Sonja (2014). „Tekstowy korpus a dalše informaciske srědki wo hornjoserbskej rěči w interneće”. Studia z Filologii Polskiej i Słowiańskiej. Warszawa: Instytut Slawistyki, Polskiej Akademii Nauk (49): 62. 
  5. ^ а б Wölkowa, Sonja (2014). „Tekstowy korpus a dalše informaciske srědki wo hornjoserbskej rěči w interneće”. Studia z Filologii Polskiej i Słowiańskiej. Warszawa: Instytut Slawistyki, Polskiej Akademii Nauk (49): 63. 
  6. ^ Wölkowa, Sonja (2014). „Tekstowy korpus a dalše informaciske srědki wo hornjoserbskej rěči w interneće”. Studia z Filologii Polskiej i Słowiańskiej. Warszawa: Instytut Slawistyki, Polskiej Akademii Nauk (49): 64. 

Спољашње везе uredi