Википедија:MedijaViki
Ova stranica na Vikipediji je prevaziđena, a ovde je zadržana prevashodno iz arhivskog interesa. |
Ovo je mjesto predviđeno za koordinaciju između saradnika u radu proširenja i implementacije Vikimedija softvera za srpski jezik, kao i za komentare ostalih zainteresovanih posjetilaca :-) |
Implementacija LAT-ĆIR-E-IJE uredi
Stanje uredi
- Izvorni kod se vodi (i snima u bazu podataka) ćirilicom (do daljnjeg)
- Konverzija ćirilice u latinicu i obratno je automatska (pri kliku na odgovarajuću grupu)
- Još ne postoji (ili mi je izmakla) sintaksa za odvajanje riječi koje ne treba da se konvertuju (orginalna imena i nazivi, stručni izrazi i slično)
- Postoji. Između dve zagrade: ((ne preslovljavaj)). --Miloš Rančić (razgovor) 08:01, 6 maj 2005 (CEST)
- Nažalost to fukcioniše samo djelimično ... problem nastaje ako između duplih zagrada postoji neka veza (ne konvertira se samo dio do veze) :-(, znači potrebna je korektura algoritma (RegExp) --Kaster 09:41, 6 maj 2005 (CEST)
- Da, Žengžu se žalio na to da ne zna dobro regularne izraze. Mislim da imaš njegovu adresu. Možda bi bilo dobro da nas trojica razmenjujemo mejlove tim povodom, a ovde da prikazujemo šta se dešava? --Miloš Rančić (razgovor) 14:26, 6 maj 2005 (CEST)
- Nažalost to fukcioniše samo djelimično ... problem nastaje ako između duplih zagrada postoji neka veza (ne konvertira se samo dio do veze) :-(, znači potrebna je korektura algoritma (RegExp) --Kaster 09:41, 6 maj 2005 (CEST)
- Podrška za ekavski/ijekavski fukncioniše. U upotrebi je sintaksa ((mleko; mlijeko)).
- Greška pri sl. scenariju: Klikom na link iz strane sa ijekavskom varijantom se ne dolazi na stranu sa ijekavskom nego ekavskom (standard) varijantom. Znači, potrebna je korektura/implementacija praćenja aktivne varijante preko "više slojeva poziva", tj. globalno snimanje i "nošenje" aktuelne varijante.
- Broj varijanti je 5 (!) Pored "Srpski-Ćir-E", "Srpski-Ćir-Ije", "Srpski-Lat-E" i "Srpski-Lat-Ije", postoji i varijanta "Srpski" što je nepotrebno. Konačno, jedna varijanta mora da bude vodeća (standardna). Da li će vodeću varijantu moći svaki korisnik sebi da konfiguriše ili će biti "centralno" određena (Srpski-Ćir-E ?) - vidjećemo.
- Ukupan broj varijanti treba da je 4. Standardna varijanta (ili korisnička ili globalna) bi trebalo da se krije iza linka "članak" (article), dok bi ostala tri trebalo smjestiti skroz desno.
- Imamo još par sitnih greškica u nazivima grupa i sl.
- Postoji par nejasnoća sa konverzionim tabelama, kao na primjer ...
(LanguageSr.php, array $mToLatin) садржи следеће: 'd!ž'=> 'dž' , 'l!j'=> 'lj' , 'n!j'=> 'nj' , 'D!ž'=> 'Dž' , 'D!Ž'=> 'DŽ' , 'L!j'=> 'Lj' , 'L!J'=> 'LJ' , 'N!j'=>'Nj' , 'N!J'=>'NJ' ,
... naime d!žd!ž nije ćirilica i samim tim je taj par nepotreban (ili sam ja nešto pobrkao).
- Pa samo utoliko što je to spremanje za sledeću fazu. Drugim rečima, od trenutka implementacije softvera, tehnički će biti moguće pisati mešanim sorsom. Ipak, naša jezička politika u toj fazi (dok god nemamo mogućnost kontrole upisa) ostaje da se može pisati samo ćirilicom i ekavski (uz moguće označavanje ekavsko-ijekavskih varijanata, svakako) sve dok ne budemo ovladali upisom u bazu; što će se dogoditi u neko dogledno vreme. Faktički, takvo stanje je prouzrokovano time što bi Žengžuu trebalo znatno više vremena da odmah implementira sve. --Miloš Rančić (razgovor) 08:35, 6 maj 2005 (CEST)
Postoje i drugi primjeri sa sličnom tematikom. --Kaster 02:15, 4 maj 2005 (CEST)
Sledeći koraci uredi
- Korigovati algoritam (vjerovatno RegExp) za odvajanje riječi bez konverzije
- Izrada uputstva (dokumentacije)
Sredstva za rad uredi
- Ažuriranje i praćenje istorije grešaka
- Test-softver.
Diskusija uredi
Pa ovako... ideja je odlična i lepo je što se neko tome posvećuje. Ali ima tu problema u konceptu. Prvo, nije dovoljno da može da se čita, pa i da se piše i ćirilicom i latinicom. Tu je osnovni problem što neki ljudi jednostavno nemaju ćirilicu na kompjuteru, pa im treba tekst latinicom i kad uređuju članak koji je neko napisao ćirilicom. Znači, treba raditi totalnu konverziju ili u ćirilicu ili u latinicu kad se članak snimi, pa konvertovati po potrebi za one koji koriste drugo.
Drugo, problem je kad se dozvoli pisanje teksta koji većina ljudi ne vidi, znači ((belo; bijelo)). Tu ja mogu da stavim iza ; i neku nepristojnu reč ili političku parolu, i ako na nekoj stranici uradim puno valjanih promena i jednu takvu, neće to niko ni uhvatiti. Znači da mogu ljudi da pišu u enciklopediju stvari koje nećemo ni primetiti.
Dakle, kako bi trebalo da radi:
- (j), (ij) ispred e, (e/i) u sredini reči
- N(j)emačka --> Nemačka, Njemačka
- b(ij)elo --> belo, bijelo
- b(e/i)l(j)eznica -> beležnica, bilježnica
- lj, nj, dž --> lj, nj, dž bez milosti, sintaksa za razdvajanje će trebati jako retko i već postoji u html
- mišljenje --> mišljenje
- nad‌živeti --> nadživeti
- Kardel‌jevo -->Kardeljevo, kako je pisalo nekad na železničkoj stanici u Pločama.
- <nocc>bez konverzije</nocc>
- ...da ne izmišljamo džaba novu sintaksu
Zocky 14:06, 18 maj 2005 (CEST)
- Malo sam ispao iz štosa glede ovog (i molim Kastera da on preuzme kormilo glede implementacije!), ali da navedem neke stvari: Ekavsko-ijekavski može biti napisano i ml((e;ije))ko. Problem sa Nemačkom je što si krenuo latinicom, a nisi video kako to izgleda ćirilicom :) (može i beležnica/bilježnica kao drugi primer :) ). Formalno je naporno se zajebavati sa nekoliko seta pravila, a i ko ti garantuje da to nije bila namerna zagrada? Zato su dve zagrade. Što se tiče izostavljanja konverzije, tu je stvar u tome što sam se trudio da se koriste samo oni znakovi koji postoje na srpskim tastaturama. Samo u posebnim slučajevima znakovi <> postoje (ako je shift kraće i pored ima taj znak), dok uglavnom ne postoje. Dalje, "dž" se češće pojavljuje od "dž". Hm. Koristim Fajerfoks i ne razumem šta si napisao kod nadživeti i Kardeljeva? Usput, da kažem da, što se tiče sintakse, princip je sasvim prihvatljiv. Kinezi koriste znatno složeniju sintaksu za razlike. I nije HTML. Ali, možemo detaljno o svakom predlogu/principu... --Miloš Rančić (razgovor) 16:45, 18 maj 2005 (CEST)
Evo po tačkama, da se lepše vidi:
- Ne znam koliko se često upotrebljava razdvojeno dž, ali meni stvarno ne izgleda da češće nego spojeno. Teško mi se i setiti primera osim nadživeti, a ovih drugih koliko hoćeš, od džezve i džanarike do vradžbine. Al ko što rekoh, nemam podatak.
- Ono ‌ je html kod za razdvajanje znakova u jezicima gde nesto znace spojeni. U tekstu se ne vidi, ali razdvaja slova: ab. Jeste da je ružno ali retko treba.
- Može lako da se konvertuje i N(J)emačka u Nemačka i Njemačka pa to nije neki veliki problem.
- Za slučaj bilježnice sam dodao gore predlog. Zocky 20:29, 18 maj 2005 (CEST)