Википедија:Vikiprojekat WikiELTeC


WikiELTeC je projekat Vikimedije Srbije i Društva za jezičke resurse i tehnologije JeRTeh zamišljen da se u 2022. godini stari srpski romani iz kolekcije ELTeC predstave Vikipodacima. Projekat obuhvata unos, povezivanje imenovanih entiteta, vizuelizaciju i analiza unetih Vikipodataka.

Cilj projekta uredi

Cilj projekta je da se unesu viki podaci o starim srpskim romanima koji su skanirani, ručno korigovani, opremljeni metapodacima, obeleženi imenovanim entitetima u okviru Cost D-reading akcije CA16204 (2017-2021) „Udaljeno čitanje za evropsku istoriju književnosti“ (D-reading). Jedan od najvažnijih ciljeva ove akcije je priprema višejezičnog korpusa (nazvanog European Literary Text Collection - ELTeC) koji će, kada bude potpuno završen, sadržati po 100 romana prvi put objavljenih u periodu 1840-1920 za svaki jezik iz akcije. Tim predvođen prof. Cvetanom Krstev je publikovao 100 romana u osnovnoj i 20 u proširenoj podkolekciji, što predstavlja osnovni resurs za wikiELTeC projekat. Aktivnosti projekta su usmerene na:

  • Povećanje broja vikipedijanaca
  • Proširenje vrsta aktivnisti vikipedijanaca
  • Unos novih zapisa u Vikipodatke
  • Unos novih zapisa u Vikizvornik
  • Unapređenje postojećih resursa dinamičkim sadržajima (semantičkim i kartografskim)

Motivi za izradu projekta uredi

Romani prvi put publikovani u periodu 1840-1920. godine su slabo poznati javnosti, neki od njih nisu imali obnovljena izdanja i smatramo da je svaka promocija ovog resursa i svaki različiti oblik publikovanja važan i da doprinosi vidljivosti srpskog jezika i književnosti.

Treba napomenuti da su romani pripremljeni u pismu u kom su publikovani i to je uglavnom bila ćirilica, što je dodatno u saglasnosti sa državnim aktivnostima za očuvanje ćiriličnog pisma.

Svest o mogućnostima korišćenja strukturiranih podataka na vebu je mala i smatramo da će ovaj projekat da doprinese ne samo izgradnji vikiresursa već i unapređenju korišćenja pohranjenih vikipodataka.

Realizacija projekta uredi

Unos osnovnih viki podataka o ovim romanima je ovim projektom dopunjen za sve romane.

Proširenje skupa podataka je uključilo i lokacije gde se odvija radnja romana, glavne likove, a potom i povezivanje u samom tekstu romana sa viki podacima.[1]

Vikizvornik je planu, gde bi on bio dopunjen romanima iz ELTeC kolekcije.

Ciljna grupa uredi

Imajući u vidu popularnost Vikimedijinih projekata verujemo da bi se široj populaciji ova dragocena kolekcija, kakva do sada nije postojala za srpski, dodatno približiti i da će se osvetliti do sada nepoznata dela srpske književnosti prvi put objavljena u periodu 1840-1920.

Ciljna grupa dakle mogu biti istoričari, istoričari književnosti, đaci, studenti, i svi ostali koji nisu imali prilike da vide i pročitaju ove retke knjige, sakupljene po našim najvećim bibliotekama i privatnim kolekcijama.

Razvijeni resursi uredi

Razvijeni resursi će omogućiti raznovrsna lingvistička, filološka i informatička istraživanja. Sadržaće materijal koji nije obuhvaćen nijednim postojećim korpusom. Svi tekstovi korpusa ELTeC će postati deo digitalne biblioteke Aurora koju razvija Jerteh i Vikipodaci će biti spregnuti sa prikazom podataka o romanima. Kao rezultat projekta biće dodate stranice koje će koristeći Wikidata Query Service i SPARQL upite prikazivati na različite načine unete Vikipodatke, kao na primer mesta na kojima se dešava radnja romana. [2] Viki strana sa detaljnim prikazom upita je dostupna na Wikidata:WikiProject ELTeC/Queries.

Vizuelizacija vikipodataka o starim srpskim romanima:

slika URL opis
 
Autori - šta znamo!? Interaktivni grafikoni i prikaz stabla autora i ELTeC izdanja.
 
Veličina romana merena brojem stranica.

Veličina romana merena brojem reči.

Interaktivni balon grafikon sa romanima u kolekciji ELTeC koji imaju VIAF ID, gde je veličina kruga broj stranica ili broj reči.
 
Mapa mesta prvog izdanja romana srpELTeC kolekcije
Putujemo u mesto izdanja romana! Mesta prvog izdanja romana SrpELTeC kolekcije.
 
Koja mesta autori pominju u romanima? Interaktivni balon grafikon sa mestima koja su autori pominjali u kolekciji SrpELTeC. Veličina kruga srazmerna je broju pominjanja mesta u romanu po autorima.
 
Mesta koja se najviše pominju u romanima? Grafički prikaz broja mesta koja se pominju u kolekciji.
 
Slavimo lepa vremena! Vizuelizacija vremenske linije romana, sortirana po godini njihovog prvog objavljivanja.
 
Ko je moja žena? Interaktivni grafik supružnika u romanima.
 
Svi smo ovde! Interaktivni grafikon svih likova u romanima.
 
Interaktivni grafikon odnosa majka-dete
Pogledaj ko je majka, a ko je njeno dete! Interaktivni grafikon svih likova u romanu koji su u odnosu majka-dete.
 
Interaktivni grafikon svih likova u romanu koji su u odnosu otac-dete
Pogledaj ko je otac, a ko je dete! Interaktivni grafikon svih likova u romanu koji su u odnosu otac-dete.

Veb strana na engleskom sa upitima je dostupna na ovoj adresi.

Statistika podkolekcije ELTeC srpskih romana:

grafikon upit opis
 
https://w.wiki/5mQ6 Grafikon zavisnosti broja likova u odnosu na romane.
 
https://w.wiki/5mPu Grafikon broja pojavljivanja gradova u celoj kolekciji.
 
https://w.wiki/5mPY Prikaz mesta koja se pominju u svakom romanu.
 
https://w.wiki/5mPZ Prikaz likova koji se pominju u svakom romanu.

Sistematizacija svih stavki u Vikipodacima

Da bi se lako pristupilo svakom romanu, kao i izdanju svakog romana (elektronskom, digitalnom ili štampanom) sistematizovan je pregled svih romana na stranici WikiProject_ELTeC/srpELTeC .

 
Pregled romana srpELTeC kolekcije


Očekivani uticaj

Raspoloživost predloženih resursa će svakako približiti čitaocima Viki resursa ovaj književni period o kom nema mnogo široko dostupnih informacija, ali će kroz romane moći i da se upozna način života u gradu i selu u to vreme, običaji, jela, … Sprezanje tekstualnih podataka sa Vikipodacima će doprineti mašinskoj razumljivosti pomenutih romana i doprineti drugačijem, „udaljenom“ pogledu na srpsku književnost u periodu 1840-1920.

Raspoloživost predloženih resursa će svakako približiti čitaocima Viki resursa ovaj književni period o kom nema mnogo široko dostupnih informacija, ali će kroz romane moći i da se upozna način života u gradu i selu u to vreme, običaji, jela, … Sprezanje tekstualnih podataka sa Vikipodacima će doprineti mašinskoj razumljivosti pomenutih romana i doprineti drugačijem, „udaljenom“ pogledu na srpsku književnost u periodu 1840-1920.

Predloženi tim je uključen u COST akciju CA18209 NexusLinguarum – European network for Web-centred linguistic data science koja traje 2019-2023 te će moći da prenesu aktuelne tehnologije i znanja u viki zajednicu Srbije i dalje, ali i da koriste i promovišu rezultate ovog projekta u drugim stručnim i naučnim aktivnostima.

wikiELTeC radionica i promocija uredi

Lokacija: Univerzitet u Beogradu, Rudarsko - geološki fakultet, Đušina 7

Datum: 17.11.2022. godine u 16 časova

Satnica radionice:

16:00 – Otvaranje i pozdravna reče, Ivana Madžarević, Vikimedija Srbije

16.15 – 16.30 Prof. dr Ranka Stanković: Vikipodaci korpusa SrpELTeC: upoznavanje sa svojstvima romana

16.30 – 17:00  Milica Ikonić Nešić, Biljana Rujević: Praktičan rad na unošenju podataka o romanima.

17.00 – 17:20 Prof. dr Ranka Stanković: Osnove SPARQL upitnog jezika sa primerima pretrage SrpELTeC Vikipodataka

17.20 – 17:40 Milica Ikonić Nešić: Praktičan rad na modifikovanju postojećih i kreiranju novih SPARQL upita o romanima

17:40 – 18.00 Pauza za kafu

Satnica promocije:

18:00 – 18:15 Prof. dr Cvetana Krstev: O korpusu starih srpskih romana SrpELTeC

18:15 – 18:30 Prof. dr Ranka Stanković: Korpus SrpELTeC i Vikipodaci

18:30 – 18:45 Prof. dr Duško Vitas: Slike iz privatnog života u korpusu  SrpELTeC

18:45 – 19:15 Pitanja

19:15 -21:00 Koktel i neposredna diskusija

 
Radionica i promocija projekta WikiELTeC 2022.


Polaznici radionice imali su priliku da upoznaju SrpELTeC kroz okvir Vikipodataka i upitnog jezika SPARQL, da nauče način unošenja podataka o romanu u Vikipodatke, postave upite nad bazom znanja i generišu zanimljive dinamičke vizuelizacije podataka i romana. Drugi deo programa bio je odvojen za promociju, prilikom koje su ukratko bili predstavljeni glavni rezultati projekta SrpELTeC iz kog su proistekli motivi i ideje za projekat wikiELTeC, nakon čega je usledila demonstracija karakterističnih pretraga i vizuelizacija.

Ostale aktivnosti i radionice uredi

Ranka Stanković, zamenik predsednika Društva za jezičke resurse i tehnologije JeRTeh je održala u nedelju, 29.05.2022. radionicu pod naslovom "wikiELTeC - Vikipodaci o starim srpskim romanima iz kolekcije ELTeC" u okviru događaja Vikilajv 2022, o kom više informacija se može videti na

https://sr.wikipedia.org/wiki/Vikipedija:Vikilajv_2022 .  

Prezentacija je dostupna na viki strani projekta i na https://commons.wikimedia.org/wiki/File:Vikilajv_srpELTeC_@_Wikidata_-_Ranka_Stankovi%C4%87.pdf

Rad “Distant Reading in Digital Humanities: Case Study on the Serbian Part of the ELTeC Collection” sa referenciranjem na ovaj projekat je izložen u na prestižnoj konferenciji “13th Conference on Language Resources and Evaluation (LREC 2022)” koja je održana u Marselju 20-25 juna 2022 u organizaciji European Language Resources Association (ELRA). Rad je odštampan u zborniku radova  na stranama 3337–3345 koji je publikovan i onlajn pod licencom CC-BY-NC-4.0 dostupan na adresi

http://www.lrec-conf.org/proceedings/lrec2022/pdf/2022.lrec-1.356.pdf .

Održana je radionica na kojoj je dogovoren način povezivanja vikipodataka pomana i podataka na Ostavi i uneti su prvi zapisi. Rezultati projekta su tom prilikom predstavljeni i dr Olji Perišić koja je predavač na Univerzitetu u Torinu na Departmanu za strane jezike i kulture. Osim aktivnosti na samoj radionici, dogovoreno da ona prevede naslove romana na italijanski jezik.

Rezultati projekta uredi

Povezivanje starih srpskih romana iz perioda od 1840-1920 godine povećalo je interesovanje studenata za zaboravljenu književnost, zarobljenu u papirnim retkim verzijama. Ovakav projekat je doprineo vizuelizaciji romana i bio je inspiracija  instraživačkoj grupi za unošenje još 600 romana u Vikipodatke pisanih na 6 različitih jezika (engleski, mađarski, slovenački, portugalski, nemački. francuski).

Jedan od najinteresantnijih segmenata projekta bio je ručni unos likova romana i povezivanje romana sa mestima radnje. Broj romana u kojima se pojavljuje neka lokacija: najfrekventnija Srbija, potom Beograd. Na slici nisu prikazani svi gradovi samo oni koji se pojavljuju u više romana i samo poneki koji se pojavljuju u samo jednom romanu.

Uneto je 120 romana osnovne srpELTeC i srpELTeC-ext kolekcije (link). Pregled svih romana i izdanja koja se nalaze u Vikipodacima WikiProject_ELTeC/srpELTeC . Za 70 romana uneto je 965 likova, kao i više od 5 osnovnih svojstava za svaki lik, pri čemu se težilo i dopunjavanju rodbinskih odnosa, ljubavnih odnosa, načina smrti, zanimanja, nadimaka, https://w.wiki/5mPZ. Takođe, uneto je 136 različitih mesta radnje https://w.wiki/5nhK, računajući pojavljivanje po romanima ukupnos 249 https://w.wiki/5mPY.

Projekat je nagrađen kao najuspešniji u 2022. godini. 

 
Pohvalnica za najbolji projekat u 2022. godini

Projekat je bio motivacija za projekat realizovan u 2023. godini Vikipedija:Vikiprojekat WikiELTeC 2023.

Vidi još uredi

Urednici uredi

 
wikiELTeC: Vikipodaci o starim srpskim romanima iz kolekcije ELTeC

Spoljne veze uredi

Reference uredi

  1. ^ http://jerteh.rs/wp-content/uploads/2021/12/Named-Entity-Journey-from-Unitex-to-Wikidata-.pdf
  2. ^ IKONIĆ NEŠIĆ, Milica; STANKOVIĆ, Ranka; RUJEVIĆ, Biljana. Serbian ELTeC Sub-Collection in Wikidata. Infotheca - Journal for Digital Humanities, [S.l.], v. 21, n. 2, p. 60-87, feb. 2022. ISSN 2217-9461. https://infoteka.bg.ac.rs/ojs/index.php/Infoteka/article/view/2021.21.2.4_en