Отворите главни мени

Горњолужичкосрпски текстуални корпус

Горњолужичкосрпски текстуални корпус (глсрп. HOrnjoserbski Tekstowy KOrpus; скраћ. HoTKo)[1] дигитални је текстуални корпус горњолужичкосрпског језика.

Горњолужичкосрпски текстуални корпус
Горњолужичкосрпски текстуални корпус.png
Резултати прегледа на сајту kontext.korpus.cz (2019)
Веб-адресаkontext.korpus.cz
Комерцијалностне
Доступан нагорњолужичкосрпски
ВласникКарлов универзитет
Покренут2001

ИсторијаУреди

Историја горњолужичкосрпског текстуалног корпуса је повезана са пројектом Лужичкосрпског института за стварање електронског једнојезичног горњолужичкосрпског речника у првој половини 1990-их година. Међутим, овај пројекат није реализован. Године 1996, почео је рад на стварању електронског горњолужичкосрпског текстуалног корпуса. Оснивач корпуса био је радник Лужичкосрпског института Едвард Ворнар. Након што се 2003. године Ворнар преселио у Лајпциг, одговорност је прешла на руководиоца Лужичкосрпке централне библиотеке Франца Шена.[2] Године 2001, корпус је почео да ради на сајту Лужичкосрпског института. Онда је био двојезичан — лужичкосрпско-енглески.[3] У одабирању актуелних текстова (књига, новина и часописа) учествовали су Народно издавачко предузеће „Домовина” у Бауцену и Језички центар WITAJ. Већина текстова је скенирана од стране научно-техничког персонала Лужичкосрпског института.[4] Горњолужичкосрпски текстуални корпус ради у сарадњи са Институтом чешког националног корпуса на Филозофском факултету Карловог универзитета у Прагу.[1]

Садржај корпусаУреди

Мали део текстова корпуса, који се углавном односе на 19. век, чува историјску орфографију. Тако, на пример, уместо савременог š користи се историјско sch, уместо савремених ć/čcź/cž, уместо савремених s/zß/s. Текстови 20. века до 1945. године користе kh за савремено h на почетку морфема и меке ŕ.[5]

Већина текстова је публицистика (57 %), затим — белетристика (23 %), верски текстови (4 %), научни текстови (4 %), речници и књиге за терминологију за поједине школске предмете (12 %). Најстарији текстови припадају првој половини 19. века (дела Х. Зејлера и Р. Мења, бројеви „Часописа Матице лужичкосрпске” од 1848. године), најновији текстови су новине „Сербске новини[5] и часопис Katolski Posoł. Већина текстова односи на период након 1989/1990. година (54 %). Текстови 19. века чине 10 % корпуса, прве половине 20. века до 1945. године — 18 %, за период између 1945. и 1990. година — 19 %.[6] Резултати претраге према корпусу дају информације о извору (аутору, наслову, месту и времену публикације).[1]

РеференцеУреди

  1. 1,0 1,1 1,2 Wölkowa, Sonja (2014). „Tekstowy korpus a dalše informaciske srědki wo hornjoserbskej rěči w interneće”. Studia z Filologii Polskiej i Słowiańskiej. Warszawa: Instytut Slawistyki, Polskiej Akademii Nauk (49): 65. 
  2. ^ Wölkowa, Sonja (2014). „Tekstowy korpus a dalše informaciske srědki wo hornjoserbskej rěči w interneće”. Studia z Filologii Polskiej i Słowiańskiej. Warszawa: Instytut Slawistyki, Polskiej Akademii Nauk (49): 60. 
  3. ^ Wölkowa, Sonja (2014). „Tekstowy korpus a dalše informaciske srědki wo hornjoserbskej rěči w interneće”. Studia z Filologii Polskiej i Słowiańskiej. Warszawa: Instytut Slawistyki, Polskiej Akademii Nauk (49): 61. 
  4. ^ Wölkowa, Sonja (2014). „Tekstowy korpus a dalše informaciske srědki wo hornjoserbskej rěči w interneće”. Studia z Filologii Polskiej i Słowiańskiej. Warszawa: Instytut Slawistyki, Polskiej Akademii Nauk (49): 62. 
  5. 5,0 5,1 Wölkowa, Sonja (2014). „Tekstowy korpus a dalše informaciske srědki wo hornjoserbskej rěči w interneće”. Studia z Filologii Polskiej i Słowiańskiej. Warszawa: Instytut Slawistyki, Polskiej Akademii Nauk (49): 63. 
  6. ^ Wölkowa, Sonja (2014). „Tekstowy korpus a dalše informaciske srědki wo hornjoserbskej rěči w interneće”. Studia z Filologii Polskiej i Słowiańskiej. Warszawa: Instytut Slawistyki, Polskiej Akademii Nauk (49): 64. 

Спољашње везеУреди