Википедија:MedijaViki

Ova stranica na Vikipediji je prevaziđena, a ovde je zadržana prevashodno iz arhivskog interesa.

Ovo je mjesto predviđeno za koordinaciju između saradnika u radu proširenja i implementacije Vikimedija softvera za srpski jezik, kao i za komentare ostalih zainteresovanih posjetilaca :-)

Implementacija LAT-ĆIR-E-IJE uredi

Stanje uredi

Izvorni kod se vodi (i snima u bazu podataka) ćirilicom (do daljnjeg)
Konverzija ćirilice u latinicu i obratno je automatska (pri kliku na odgovarajuću grupu)
Još ne postoji (ili mi je izmakla) sintaksa za odvajanje riječi koje ne treba da se konvertuju (orginalna imena i nazivi, stručni izrazi i slično)
1. Postoji. Između dve zagrade: ((ne preslovljavaj)). --Miloš Rančić (razgovor) 08:01, 6 maj 2005 (CEST)

Nažalost to fukcioniše samo djelimično ... problem nastaje ako između duplih zagrada postoji neka veza (ne konvertira se samo dio do veze) :-(, znači potrebna je korektura algoritma (RegExp) --Kaster 09:41, 6 maj 2005 (CEST)

Da, Žengžu se žalio na to da ne zna dobro regularne izraze. Mislim da imaš njegovu adresu. Možda bi bilo dobro da nas trojica razmenjujemo mejlove tim povodom, a ovde da prikazujemo šta se dešava? --Miloš Rančić (razgovor) 14:26, 6 maj 2005 (CEST)

Podrška za ekavski/ijekavski fukncioniše. U upotrebi je sintaksa ((mleko; mlijeko)).
1. Greška pri sl. scenariju: Klikom na link iz strane sa ijekavskom varijantom se ne dolazi na stranu sa ijekavskom nego ekavskom (standard) varijantom. Znači, potrebna je korektura/implementacija praćenja aktivne varijante preko "više slojeva poziva", tj. globalno snimanje i "nošenje" aktuelne varijante.
Broj varijanti je 5 (!) Pored "Srpski-Ćir-E", "Srpski-Ćir-Ije", "Srpski-Lat-E" i "Srpski-Lat-Ije", postoji i varijanta "Srpski" što je nepotrebno. Konačno, jedna varijanta mora da bude vodeća (standardna). Da li će vodeću varijantu moći svaki korisnik sebi da konfiguriše ili će biti "centralno" određena (Srpski-Ćir-E ?) - vidjećemo.
Ukupan broj varijanti treba da je 4. Standardna varijanta (ili korisnička ili globalna) bi trebalo da se krije iza linka "članak" (article), dok bi ostala tri trebalo smjestiti skroz desno.
Imamo još par sitnih greškica u nazivima grupa i sl.
Postoji par nejasnoća sa konverzionim tabelama, kao na primjer ...

(LanguageSr.php, array $mToLatin) садржи следеће:

'd!ž'=> 'dž'  ,
'l!j'=> 'lj'  ,
'n!j'=> 'nj'  ,
'D!ž'=> 'Dž'  ,
'D!Ž'=> 'DŽ'  ,
'L!j'=> 'Lj'  ,
'L!J'=> 'LJ'  ,
'N!j'=>'Nj'   ,
'N!J'=>'NJ'   ,

... naime d!žd!ž nije ćirilica i samim tim je taj par nepotreban (ili sam ja nešto pobrkao).

Pa samo utoliko što je to spremanje za sledeću fazu. Drugim rečima, od trenutka implementacije softvera, tehnički će biti moguće pisati mešanim sorsom. Ipak, naša jezička politika u toj fazi (dok god nemamo mogućnost kontrole upisa) ostaje da se može pisati samo ćirilicom i ekavski (uz moguće označavanje ekavsko-ijekavskih varijanata, svakako) sve dok ne budemo ovladali upisom u bazu; što će se dogoditi u neko dogledno vreme. Faktički, takvo stanje je prouzrokovano time što bi Žengžuu trebalo znatno više vremena da odmah implementira sve. --Miloš Rančić (razgovor) 08:35, 6 maj 2005 (CEST)

Postoje i drugi primjeri sa sličnom tematikom. --Kaster 02:15, 4 maj 2005 (CEST)

Sledeći koraci uredi

Korigovati algoritam (vjerovatno RegExp) za odvajanje riječi bez konverzije
Izrada uputstva (dokumentacije)

Sredstva za rad uredi

Ažuriranje i praćenje istorije grešaka

Bugzilla

Test-softver.

Ja imam dobra iskustva sa PureTest-om.
Možda uskoro dolazi u obzir i Solex.

Diskusija uredi

Pa ovako... ideja je odlična i lepo je što se neko tome posvećuje. Ali ima tu problema u konceptu. Prvo, nije dovoljno da može da se čita, pa i da se piše i ćirilicom i latinicom. Tu je osnovni problem što neki ljudi jednostavno nemaju ćirilicu na kompjuteru, pa im treba tekst latinicom i kad uređuju članak koji je neko napisao ćirilicom. Znači, treba raditi totalnu konverziju ili u ćirilicu ili u latinicu kad se članak snimi, pa konvertovati po potrebi za one koji koriste drugo.

Drugo, problem je kad se dozvoli pisanje teksta koji većina ljudi ne vidi, znači ((belo; bijelo)). Tu ja mogu da stavim iza ; i neku nepristojnu reč ili političku parolu, i ako na nekoj stranici uradim puno valjanih promena i jednu takvu, neće to niko ni uhvatiti. Znači da mogu ljudi da pišu u enciklopediju stvari koje nećemo ni primetiti.

Dakle, kako bi trebalo da radi:

(j), (ij) ispred e, (e/i) u sredini reči: N(j)emačka --> Nemačka, Njemačka; b(ij)elo --> belo, bijelo; b(e/i)l(j)eznica -> beležnica, bilježnica
lj, nj, dž --> lj, nj, dž bez milosti, sintaksa za razdvajanje će trebati jako retko i već postoji u html: mišljenje --> mišljenje; nad&zwnj;živeti --> nadživeti; Kardel&zwnj;jevo -->Kardeljevo, kako je pisalo nekad na železničkoj stanici u Pločama.
<nocc>bez konverzije</nocc>: ...da ne izmišljamo džaba novu sintaksu

Zocky 14:06, 18 maj 2005 (CEST)

Malo sam ispao iz štosa glede ovog (i molim Kastera da on preuzme kormilo glede implementacije!), ali da navedem neke stvari: Ekavsko-ijekavski može biti napisano i ml((e;ije))ko. Problem sa Nemačkom je što si krenuo latinicom, a nisi video kako to izgleda ćirilicom :) (može i beležnica/bilježnica kao drugi primer :) ). Formalno je naporno se zajebavati sa nekoliko seta pravila, a i ko ti garantuje da to nije bila namerna zagrada? Zato su dve zagrade. Što se tiče izostavljanja konverzije, tu je stvar u tome što sam se trudio da se koriste samo oni znakovi koji postoje na srpskim tastaturama. Samo u posebnim slučajevima znakovi <> postoje (ako je shift kraće i pored ima taj znak), dok uglavnom ne postoje. Dalje, "dž" se češće pojavljuje od "dž". Hm. Koristim Fajerfoks i ne razumem šta si napisao kod nadživeti i Kardeljeva? Usput, da kažem da, što se tiče sintakse, princip je sasvim prihvatljiv. Kinezi koriste znatno složeniju sintaksu za razlike. I nije HTML. Ali, možemo detaljno o svakom predlogu/principu... --Miloš Rančić (razgovor) 16:45, 18 maj 2005 (CEST)

Evo po tačkama, da se lepše vidi:

Ne znam koliko se često upotrebljava razdvojeno dž, ali meni stvarno ne izgleda da češće nego spojeno. Teško mi se i setiti primera osim nadživeti, a ovih drugih koliko hoćeš, od džezve i džanarike do vradžbine. Al ko što rekoh, nemam podatak.
Ono &zwnj; je html kod za razdvajanje znakova u jezicima gde nesto znace spojeni. U tekstu se ne vidi, ali razdvaja slova: a‌b. Jeste da je ružno ali retko treba.
Može lako da se konvertuje i N(J)emačka u Nemačka i Njemačka pa to nije neki veliki problem.
Za slučaj bilježnice sam dodao gore predlog. Zocky 20:29, 18 maj 2005 (CEST)