Википедија:МедијаВики

(преусмерено са Википедија:Медијавики)

Ово је мјесто предвиђено за координацију између сарадника у раду проширења и имплементације Викимедија софтвера за српски језик, као и за коментаре осталих заинтересованих посјетилаца :-)


Имплементација ЛАТ-ЋИР-Е-ИЈЕ уреди

Стање уреди

  1. Изворни код се води (и снима у базу података) ћирилицом (до даљњег)
  2. Конверзија ћирилице у латиницу и обратно је аутоматска (при клику на одговарајућу групу)
  3. Још не постоји (или ми је измакла) синтакса за одвајање ријечи које не треба да се конвертују (оргинална имена и називи, стручни изрази и слично)
    1. Постоји. Између две заграде: ((не пресловљавај)). --Милош Ранчић (разговор) 08:01, 6 мај 2005 (CEST)
Нажалост то фукционише само дјелимично ... проблем настаје ако између дуплих заграда постоји нека веза (не конвертира се само дио до везе) :-(, значи потребна је коректура алгоритма (RegExp) --Kaster 09:41, 6 мај 2005 (CEST)
  • Да, Женгжу се жалио на то да не зна добро регуларне изразе. Мислим да имаш његову адресу. Можда би било добро да нас тројица размењујемо мејлове тим поводом, а овде да приказујемо шта се дешава? --Милош Ранчић (разговор) 14:26, 6 мај 2005 (CEST)
  1. Подршка за екавски/ијекавски фукнционише. У употреби је синтакса ((млеко; млијеко)).
    1. Грешка при сл. сценарију: Кликом на линк из стране са ијекавском варијантом се не долази на страну са ијекавском него екавском (стандард) варијантом. Значи, потребна је коректура/имплементација праћења активне варијанте преко "више слојева позива", тј. глобално снимање и "ношење" актуелне варијанте.
  2. Број варијанти је 5 (!) Поред "Српски-Ћир-Е", "Српски-Ћир-Ије", "Српски-Лат-Е" и "Српски-Лат-Ије", постоји и варијанта "Српски" што је непотребно. Коначно, једна варијанта мора да буде водећа (стандардна). Да ли ће водећу варијанту моћи сваки корисник себи да конфигурише или ће бити "централно" одређена (Српски-Ћир-Е ?) - видјећемо.
  3. Укупан број варијанти треба да је 4. Стандардна варијанта (или корисничка или глобална) би требало да се крије иза линка "чланак" (article), док би остала три требало смјестити скроз десно.
  4. Имамо још пар ситних грешкица у називима група и сл.
  5. Постоји пар нејасноћа са конверзионим табелама, као на примјер ...
(LanguageSr.php, array $mToLatin) садржи следеће:

'd!ž'=> 'dž'  ,
'l!j'=> 'lj'  ,
'n!j'=> 'nj'  ,
'D!ž'=> 'Dž'  ,
'D!Ž'=> 'DŽ'  ,
'L!j'=> 'Lj'  ,
'L!J'=> 'LJ'  ,
'N!j'=>'Nj'   ,
'N!J'=>'NJ'   ,

... наиме d!žd!ž није ћирилица и самим тим је тај пар непотребан (или сам ја нешто побркао).

  • Па само утолико што је то спремање за следећу фазу. Другим речима, од тренутка имплементације софтвера, технички ће бити могуће писати мешаним сорсом. Ипак, наша језичка политика у тој фази (док год немамо могућност контроле уписа) остаје да се може писати само ћирилицом и екавски (уз могуће означавање екавско-ијекавских варијаната, свакако) све док не будемо овладали уписом у базу; што ће се догодити у неко догледно време. Фактички, такво стање је проузроковано тиме што би Женгжуу требало знатно више времена да одмах имплементира све. --Милош Ранчић (разговор) 08:35, 6 мај 2005 (CEST)

Постоје и други примјери са сличном тематиком. --Kaster 02:15, 4 мај 2005 (CEST)

Следећи кораци уреди

  1. Кориговати алгоритам (вјероватно RegExp) за одвајање ријечи без конверзије
  2. Израда упутства (документације)

Средства за рад уреди

  • Ажурирање и праћење историје грешака
  1. Bugzilla
  • Тест-софтвер.
  1. Ја имам добра искуства са PureTest-ом.
  2. Можда ускоро долази у обзир и Solex.

Дискусија уреди

Pa ovako... ideja je odlična i lepo je što se neko tome posvećuje. Ali ima tu problema u konceptu. Prvo, nije dovoljno da može da se čita, pa i da se piše i ćirilicom i latinicom. Tu je osnovni problem što neki ljudi jednostavno nemaju ćirilicu na kompjuteru, pa im treba tekst latinicom i kad uređuju članak koji je neko napisao ćirilicom. Znači, treba raditi totalnu konverziju ili u ćirilicu ili u latinicu kad se članak snimi, pa konvertovati po potrebi za one koji koriste drugo.

Drugo, problem je kad se dozvoli pisanje teksta koji većina ljudi ne vidi, znači ((belo; bijelo)). Tu ja mogu da stavim iza ; i neku nepristojnu reč ili političku parolu, i ako na nekoj stranici uradim puno valjanih promena i jednu takvu, neće to niko ni uhvatiti. Znači da mogu ljudi da pišu u enciklopediju stvari koje nećemo ni primetiti.

Dakle, kako bi trebalo da radi:

(j), (ij) ispred e, (e/i) u sredini reči
N(j)emačka --> Nemačka, Njemačka
b(ij)elo --> belo, bijelo
b(e/i)l(j)eznica -> beležnica, bilježnica
lj, nj, dž --> љ, њ, џ bez milosti, sintaksa za razdvajanje će trebati jako retko i već postoji u html
mišljenje --> мишљење
nad‌živeti --> надживети
Kardel‌jevo -->Карделјево, kako je pisalo nekad na železničkoj stanici u Pločama.
<nocc>bez konverzije</nocc>
...da ne izmišljamo džaba novu sintaksu

Zocky 14:06, 18 мај 2005 (CEST)

Мало сам испао из штоса гледе овог (и молим Кастера да он преузме кормило гледе имплементације!), али да наведем неке ствари: Екавско-ијекавски може бити написано и мл((е;ије))ко. Проблем са Немачком је што си кренуо латиницом, а ниси видео како то изгледа ћирилицом :) (може и бележница/биљежница као други пример :) ). Формално је напорно се зајебавати са неколико сета правила, а и ко ти гарантује да то није била намерна заграда? Зато су две заграде. Што се тиче изостављања конверзије, ту је ствар у томе што сам се трудио да се користе само они знакови који постоје на српским тастатурама. Само у посебним случајевима знакови <> постоје (ако је shift краће и поред има тај знак), док углавном не постоје. Даље, "дж" се чешће појављује од "џ". Хм. Користим Фајерфокс и не разумем шта си написао код надживети и Карделјева? Успут, да кажем да, што се тиче синтаксе, принцип је сасвим прихватљив. Кинези користе знатно сложенију синтаксу за разлике. И није HTML. Али, можемо детаљно о сваком предлогу/принципу... --Милош Ранчић (разговор) 16:45, 18 мај 2005 (CEST)

Evo po tačkama, da se lepše vidi:

  • Ne znam koliko se često upotrebljava razdvojeno dž, ali meni stvarno ne izgleda da češće nego spojeno. Teško mi se i setiti primera osim nadživeti, a ovih drugih koliko hoćeš, od džezve i džanarike do vradžbine. Al ko što rekoh, nemam podatak.
  • Ono &zwnj; je html kod za razdvajanje znakova u jezicima gde nesto znace spojeni. U tekstu se ne vidi, ali razdvaja slova: a‌b. Jeste da je ružno ali retko treba.
  • Može lako da se konvertuje i Н(Ј)емачка u Немачка i Њемачка pa to nije neki veliki problem.
  • Za slučaj bilježnice sam dodao gore predlog. Zocky 20:29, 18 мај 2005 (CEST)