Википедија:Трг/Архива/Википолитика/44

Сређивање чланака и шаблониУреди

Мислим да ово никуда не води. У реду, никог не занима да помогне у сређивању чланака, то сам прихватио, али свеједно с времена на време апелујем да се чланци сређују. Међутим, морам признати да сте веома комотни око лепљења шаблона. Најновији пример је Qt. Шаблон је налепљен и довиђења. Ево, наградно питање за све; шта конкретно у тексту није добро, а што је у самом шаблону наведено? Верујем да има, али ја то не видим. Хајде да се договоримо; ако нисте способни или ако вас мрзи да у две реченице образложите шаблон који сте ставили, немојте га ни стављати. Дакле, молим вас, ако је икако могуће, да на тај начин не помажете.--Методичар зговор2а 18:07, 24. децембар 2009. (CET)

Скренућу пажњу и на Разговор:Qt. С обзиром да се макар мени не свиђају поједине формулације у чланку, верујем да је неки шаблон потребан да обележи потребу за поправком. Сад, што шаблон зове све, а само узак круг људи може да га среди је већ ван ове теме. Што се мене тиче, ознака се може склонити, али то неће помоћи чланку. Овако су макар веће шансе да:

  1. Чланак неког не дезинформише
  2. Неко наиђе на њега и среди га

Михајло [ talk ] 18:22, 24. децембар 2009. (CET)

Уопште није поента у склањању налепнице, него у објашњењу исте. Када је врло очигледно чланак за сређивање, објашњење није потребно. У овом случају јесте потребно. И ајде макар једном у животу да на овој њикипедији будемо реални, а не протоколарни као што смо увек. Прво сваки чланак који нема наведену литературу има добре изгледе да неког „дезинформише“, па по том питању прстом не мрдамо, а друго нико га неће средити до нас самих (ја у тог хипотетичког неког не верујем). А баш ми лепо дођемо, оставимо налепницу и одлепршамо у виду ластиног репка. :)--Методичар зговор2а 18:40, 24. децембар 2009. (CET)

За граматичке и стилске измене користимо шаблон {{чишћење}}, те сам то променио. Мени лично стварно не изгледа да је стање на чланку проблематично; мислим да би налепнице требало да резервишемо за чланке који су у критичнијем стању од овог. Вас двојица гледајте да се не посвађате опет :) --Dzordzm (разговор) 20:25, 24. децембар 2009. (CET)

Уместо да гледаш шта други раде, могао би да прођеш кроз своје грешке прошлости, како ти се више не би десило да блокираш кориснике без упозорења и како би почео да пишеш разлоге блока који иоле одговарају стварности. 本 Михајло [ talk ] 11:40, 27. децембар 2009. (CET)

Па и да се посвађамо, сигуран сам да би ти то решио. :) Нећемо се Михајло и ја свађати, посебно не око ове теме, јер се само не разумемо. Дакле, није спорно да налепница стоји, али ако некога већ мрзи да поправи 4 киле текста, онда макар може у реченици приликом убацивања шаблона да напише „у тексту има граматичких и/или материјалних грешака...“ или шта ли већ. Уколико неко само стави шаблон, тако не помаже ни чланку ни другим уредницима. Јер ако се чланку замера правопис, али не и струка, онда може било ко ко има елементарно знање да ускочи. Надам се да сам појаснио. :)--Методичар зговор2а 21:07, 24. децембар 2009. (CET)

Важно: главна страна, изабран чланакУреди

Већ три дана немамо изабрани чланак на главној страни. Прекјуче је Филип интервенисао и продужио претходни изабрани чланак, јуче и данас сам ја. Дакле, врло је битно да се ово среди јер ако у поноћ није припремљено који ће следећи чланак да стоји, пукне линк на главној страни и то прилично ружно изгледа. Јуче сам на срећу видео и реаговао шеснаест минута после поноћи, али данас смо имали покварену главну страну скоро четири сата :(

Не знам каква је политика постављања сјајних чланака на главну страну, и нисам претерано рад да се у то удубљујем. Али тренутна ситуација не ваља, па ако се нико други не прихвати да среди ово за наредних пар месеци, видећу да ја то средим. -- Обрадовић Горан (разговор) 03:50, 26. децембар 2009. (CET)

Враћаћко правоУреди

Дали се је мени то средило, дао сам захтев негде, немогу ни наћи те ствари. То је веч од пре 1-2 месеца. --Mile (разговор) 13:08, 12. јануар 2010. (CET)

Гласање о измјени правила избора за сјајни чланак...Уреди

...је отворено овдје. Позив свим заинтерсованима да баце поглед и евентуално гласају. --Славен Косановић {разговор} 07:11, 13. јануар 2010. (CET)

Измјена политике избора и укидања права администраторимаУреди

У току је дискусија о измјени политике избора и укидања права администраторима. Позив свим заинтересованим за учешће у дискусији и евтл. каснијем гласању. Поз, --Kašter (разговор) 09:53, 16. јануар 2010. (CET)

Масовни унос, ботУреди

Малопре сам зауставио бота који је радио масовни унос живих врста. Никола Смоленски и ја смо имали неких примедби на рад овог бота и преко мејла сам замолио Мирослава да док се те примедбе не расправе на Тргу заустави тај масовни унос. Колико сам разумео, Мирослав се сложио са тим, али сам малопре уочио да је масовни унос и даље у току. Не знам да ли је дошло до неспоразума или до грешке у конфигурационој скрипти, па сам зауставио бота блокиравши налог који користи док не видимо о чему је реч. У наставку започињем дискусију о проблематичном масовном уносу. За почетак ћу пејстовати мејл који сам јуче послао Мирославу и Николи. -- Обрадовић Горан (разговор) 23:29, 1. фебруар 2010. (CET)


Преносим мејл који сам јуче послао Мирославу и Николи:

Мој је принципијелан став да ништа у животу не треба радити half-ass илити с пола гузице. То важи и за масовне уносе. Масовни уноси не смеју да буду јурцање већ у њих мора да буде уложена дужна пажња и труд. Пример квалитетног масовног уноса је унос српских села, пројекат који је водио Филип, а мање или више су му помагали многи.

За овај пројекат су прикупљени подаци који су могли да буду нађени у електронском облику. И кад кажем сви, не мислим на то да је неко гуглао податке, већ је темељно претражен Интернет, проверено је са свим релевантним институцијама, направљен је договор и отишло се по податке које те институције поседују. Подаци су прегледани и ручно исправљени где је било потребно (што свакако није било лако али је било неопходно). Резултат пројекта је да данас кад инжењерима Телекома Србија требају подаци о некој вукојебини у Србији оду и податке потраже на Википедији. Након овога је пројекат настављен и на исти начин су унета села у Црној Гори. Без прављења компромиса што се тиче квалитета и нико никада није имао примедби на тај пројекат.

Рад на овом пројекту је трајао шест месеци.

О једном живом организму свакако постоји много више података него о селу у Србији. Подаци које бот тренутно уноси су колико видим следећи:

  • подаци о угрожености
  • подаци о станишту (проблематичне тачности колико сам разумео)
  • систематизација (латински назив, род, фамилија...)

То није довољно. Податке о српским селима може да има пар институција у Србији и пар америчких база података. Податке о живим врстама може да има ~400 биолошких факултета у свету и ~200 биолошких института у свету. Требало би обићи њихове сајтове и видети ко има потребне податке (неко сигурно има). Под којим условима могу да нам их дају или продају (овако нешта би Викимедија могла да плати).

Нисам биолог али покушаћу сад да набацам пар података које би могли и требали да имају чланци о живим врстама:

  • животни век
  • начин размножавања
  • број младунаца (период инкубације, ...)
  • бројност (график који приказује бројност кроз историју?)
  • од кад постоји
  • чиме се храни
  • природни непријатељи
  • димензије
  • како живи (као самац, у јату, стаду, чопору...)
  • слика (за већину животињских врста постоје слике, рецимо остава има ~30.000 слика мрава.. у слике се свакако мора уложити труд)
  • можда чак егзотични подаци типа број хромозома

Даље, специфичности: животињских врста има јако јако пуно и свакако да им треба посветити макар толико пажње да се унос ради слојевито по категоријама, и да се поштују специфичности сваке категорије. Ако уносимо сисаре подаци о отровности нису релевантни. Ако уносимо рептиле јесу. Сигуран сам да се дају пронаћи систематизовани подаци о змијским врстама по отровима (постоје ваљда три типа отрова, па која змија има који? колико јак и у којој количини га лучи? да ли га пљује или уједа...). За птице нам је интересантно да ли су селице или не, какви су летачи и тако даље.

Можда све ово и није смислено али то су идеје које је лаик набацао за пет минута у пет ујутро. Биолози би могли да дају много више много квалитетнијих идеја. У ствари, за очекивати је да у току припреме пројекта масовног уноса за чланке о животињским врстама буде припремљено толико података да мора да се врши селекција.

Мој је предлог да се овај пројекат разбије на мање пројекте по класама или родовима и да се за сваку овакву категорију одраде примерени чланци. Живи свет је толико разнолик да ако се ради све одједном то никако не може да буде квалитетно. Или ће чланци да обухвате само податке који се тичу свих врста и да буду потпуно штури, или ћемо имати глупости типа Шева није отровна или Брзина лета букве је 0km/h.

Али у овакав пројекат ваља улазити само ако постоји довољан број људи (може и једна особа) који су спремни да довољно засучу рукаве и да уложе сав потребан труд. За масовни унос који се мери десетинама хиљада чланака шест месеци или годину дана рада је ништа.

Још један пример лошег масовног уноса је Милошев унос француских села. То је изгледало овако (нетранскрибовано име села, департмана и региона и скоро без података). После тога је чланак измењен у ово (уз много више труда и ручног рада него да је одмах урађено како ваља!). Овај пример наводим зато што након четири године од првобитног уноса још увек трају континуирани напори да се ови чланци приведу нечем шта би се могло назвати крштен чланак. То је мој коментар на сваку акцију типа ајде сад да набацамо, после ћемо лако да средимо.

Овај мејл можеш слободно да пејстујеш на Тргу. У ствари вероватно ћу ја то урадити јер тамо треба да се води ова расправа. По самој својој суштини, на Википедији се одлучује консензусом. Око оваквог масовног уноса очигледно да не постоји консензус (имам разлога да верујем да Никола и ја нисмо једин који нису срећни са том одлуком), тако да се пре наставка процеса мора доћи до договора на Тргу или питање расправити на гласању. -- Обрадовић Горан (разговор) 23:37, 1. фебруар 2010. (CET)

Апсолутно подржавам став о пола гузице ;). Из истог разлога сам обуставио рад на уносу 18.000 фудбалера и 13.000 њемачких насељених мјеста. У првом случају су подаци били прилично непоуздани и за поприличан дио чланака непотпуни, док је ситуација у другом случају била много боља (транскрипција је завршена) и радови су били поприлично поодмакли, али се пројекат није привео крају због недостатка времена.
Дакле, представити статистичке податке, за колико чланака постоји колико којих података, па ћемо видјети. До тада, пауза. Поз, --Kašter (разговор) 00:45, 2. фебруар 2010. (CET)
Примјер да овај унос није у реду је нпр. интервики према њемачкој википедији, иако тамо наведени чланак не постоји - нити је икада постојао (Littoraria flammea). Исти случај за Alzoniella_elliptica на енглеској вики. --Kašter (разговор) 01:00, 2. фебруар 2010. (CET)

Јасне су ми примедбе које су изнесене на рачун овог масовног уноса, али...

  • Латински назив врста је научни и општеприхваћени назив који не мора да се мења, а уосталом већина тих врста никада није ни добила назив на српском. Тако да то не може никако да се пореди са транскрибовањем француских села.
Нисам ништа рекао у вези са латинским називима. Нетранскрибована француска села су одговор на лако-ћемо принцип. И сам си рекао: Грешке могу лако ручно да се исправе (не не могу, тј могу али неће бити исправљене.). -- Обрадовић Горан (разговор) 01:37, 2. фебруар 2010. (CET)
  • Предлог за поднаслове типа бројност (график који приказује бројност кроз историју?) ми звучи, дозволићете, у најмању руку шокантно. Обрадовић Горан је самоуверено загазио у област коју не познаје, те бих га обавестио да није спровођен попис животиња у прошлости, осим домаће стоке која није у овом масовном уносу. Не може се утврдити кретање бројности ни животиња најпознатијих човеку, а да не помињем неколико десетина хиљада врста о којима се не зна скоро ништа.
  • Та предложена поглавља не могу да се унесу ботом. То може само да се ради „ручно“...гомила информација које треба да уноси један човек и да му један чланак буде превише за дан. Ботом могу да се унесу само основна поглавља, која су и унета. Грешке могу лако ручно да се исправе. Чланак може увек да се прошири тим додатним предложеним поглављима.
  • Не знам по чему су то чланци о селима у Србији бољи и детаљнији ?! Имају само податке о томе где административно припадају и податке са пописа становништва. Кад унесете ботом податке о објектима у селима онда се јавите...да видите како је то лако.

--Zrno (разговор) 01:10, 2. фебруар 2010. (CET)Зрно

Прво, ево, изгуглао сам ово. За скоро сваку од понуђених врста постоји одељак population and distribution, у коме су дате процене бројности данас и како су се кретале кроз историју. Да ли су ови подаци комплетни? Не. Да ли су погодни за машинску обраду? Не баш. Међутим, све шта сам урадио да бих дошао до тога је било да сам укуцао две претраге на Гуглу. Кад бих се томе посветио, кад бих написао пар десетина мејлова факултетима широм света, вероватно бих пронашао потпуније податке који су погодни за машинску обраду.
Друго, иако нисам мислио на попис него на процену бројног стања, није ни битно, суштина је у следећем шта сам горе написао: Можда све ово и није смислено али то су идеје које је лаик набацао за пет минута у пет ујутро. Биолози би могли да дају много више много квалитетнијих идеја. Свакако да оспоравањем једног од десетак кроки-предлога које сам дао не можеш да побијеш суштину моје примедбе. О биолошким врстама је могуће пронаћи и припремити много много много више података него што је то сад случај. -- Обрадовић Горан (разговор) 01:30, 2. фебруар 2010. (CET)
Кажеш "Грешке могу лако ручно да се исправе." Можда то и јесте тачно ако имамо унос од 10 до 50 чланака дневно. Али за ниво од 500 чланака дневно, то је нереално. Уосталом, ако се већ прави бот, не треба ићи са премисом да бот уноси погрешне информације (у неким или у већини случајева), а да људска рука мора да пређе преко чланка да би он постао употребљив, већ у таквим случајевима треба прибегавати другим решењима (једно је ручно одобравање измена, као што ја радим са DEFAULTSORT сређивањима и преусмерењима са оригиналног назива; друго је прављење привремених страница ван главног именског простора, као што је то урађено са глумцима и филмовима својевремено). --филип ██ 01:31, 2. фебруар 2010. (CET)

Ипак имате високе захтеве у вези овог масовног уноса и полазите од тога да треба да се угледа на села у Србији о којима пише само где административно припадају и имају податке са пописа. Мислим да ту још недостаје:

  • Порекло имена
  • Географија села
  • Историја
  • Привреда
  • Култура
  • Знаменитости
  • Презимена
  • Познате личности

Тако да нека Обрадовић Горан мало размисли о томе, а примедбе о грешкама у тексту прихватам.--Zrno (разговор) 01:49, 2. фебруар 2010. (CET)Зрно

Нема потребе да ми се у сваком коментару обраћаш по имену у трећем лицу. Када говориш у трећем лицу о неком ко је присутан, звучи као да имаш нешта против њега, а верујем да то овде није случај.
Сад да пређем на тему: сви подаци које сам навео тамо су подаци које би било смислено могуће наћи у машински обрадивом облику (допустио сам могућност да сам негде погрешио). Да сам хтео да набрајам без дискриминисања по том критеријуму, поменуо бих ствари типа помињање животиње у култури, здравствени проблеми, карактер и слично. На исти начин историју села, културне особености или остало шта си навео није за очекивати да се може наћи у машински обрадивом облику.
Унос села је пример доброг масовног уноса зато што су уложени значајни напори и није се штедело труда ни времена да би се прикупили и обрадили сви могући подаци. Није баш да пише само где административно припадају. Штавише уочићеш да је и код података са пописа начињен напор и да су из статистика извучени корисни и смислени подаци, који представљају не пуко копирање података из извора већ њихово анализирање и аутоматско резоновање. Тако на пример пише да је неко насеље у већини насељено Србима или да је број становника у паду. -- Обрадовић Горан (разговор) 02:05, 2. фебруар 2010. (CET)

Свеједно се за села могу наћи подаци у машинско обрадивом облику, као што су нпр. година оснивања, река или планина поред које се налази, саобраћајница, цркве, школе и други објекти у селу, презимена итд. У чланку о селима има само један поднаслов, а то је становништво. Код уноса животиња има више поднаслова, али ни то није довољно. Као да овде нису уложени значајни напори од стране Мирослава и Методичара у припреми. На месту су примедбе о грешкама које се требају превазићи, али сви ти предложени поднаслови су дискриминација и омаловажавање једног уноса у односу на други. Толико од мене. Не знам какво ће бити решење свега овог, пошто зависи само од вас....зато је ова расправа бесмислена. Лаку ноћ ! --Zrno (разговор) 02:25, 2. фебруар 2010. (CET)Зрно

река или планина поред које се налази, саобраћајница, цркве, школе и други објекти у селу :) Кад сам рекао да су уложени сви разумни напори на прикупљању, обради и селекцији података за овај масовни унос, ја се нисам шалио. -- Обрадовић Горан (разговор) 02:36, 2. фебруар 2010. (CET)
Ja sam zadovoljan samo sa uvodnom recenicom i taxoboxom, ali ako ima nezadovoljnih, ajde da vidimo sta mozemo uraditi da sredimo, umesto da prebacujemo jedni drugima. Inace, nepostojeci interwiki linkovi su tu da se poveca verovatnoca povezivanja, to nije nikakav problem. -- Bojan  Razgovor  03:33, 2. фебруар 2010. (CET)

Ovo radjenje polovicno mi je preostro, o unosu su postojale najave barem sest meseci ranije, radjene su probne versije clanke, Miroslav je ako ne sve, onda vecinu prihvatio. -- Bojan  Razgovor  03:35, 2. фебруар 2010. (CET)

Дефинитивно се та најава и синхронизација идеја није десила на за то одређеним странама. Откуд идеја да се постављају непостојећи интервики линкови. То је тотално погрешан приступ. Мислим, (иронично) онда бар да се ставе интервики за све језике, да бар после не морају силни интервики ботови да пролазе кроз њих. Тс, тс. --Kašter (разговор) 09:03, 2. фебруар 2010. (CET)
Koji je ispravan pristup? Stavljali su se linkovi ka najvecim vikipedijama i vikipedijama koje su radile masovan unos zivotinja, cime bi verovatnoca da clanak ne bude nepovezan sa drugim jezicima. Ako ne postoji clanak na drugim vikipedijama - e **** ga, ali interwikiji su najmanji problem (ili nisu problem uopste). -- Bojan  Razgovor  09:12, 2. фебруар 2010. (CET)
Ми овдје радимо не за нас (уредницима је интервики свеједно) него за посјетиоце Википедије. А они дефинитивно не очекују да се нешто кликне па да се не нађе (народски речено "гледаш одакле је ведро"). То су основни појмови ергономије и дизајна софтвера. Погледај en:Usability, en:User_experience_design или en:Human–computer interaction. --Kašter (разговор) 17:29, 2. фебруар 2010. (CET)

Између мучења корисника (?) и затрпавања списка чланака без интервикија драже ово прво. Ботови ће после пар дана, ако не постоје ти чланци, једноставно обрисати интервикије ка непостојећим страницама и крај приче. -- Bojan  Razgovor  18:02, 2. фебруар 2010. (CET)

Најискреније нисам сигуран шта се овде замера; непосвећеност овом уносу, грешке у чланцима или њихов садржај? Колико сам ја налетао на чланке овде на Њикипедији, постоје „ручно“ унесени чланци који су краћи него на овај начин унети (неки примери: 1, 2, 3, 4). Има их још, а и било их је још и то знам јер сам на некима од њих и сам радио и значајно их проширио. И сви они су и пре него што сам пристигао на Њикипедију сматрани регуларним клицама и нисам приметио да их је ико доводио у питање, као што нисам приметио ни да је истина да нико никад није доводио у питање постојање српских села на Њикипедији и то знам јер се расправљало о њиховој релевантности, где сам учествовао на страни оних који су их „бранили“. Не могу да тражим линк за то, али ваљда сте се уверили до сада да не лажем, мада можете и да ми не верујете, потпуно ми је свеједно. Такође, клице о живим бићима ни на немачкој, француској, па и енглеској (које какве год да су, боље су од наше) Њикипедије нису уопште различите.
Врсте које су изабране су угрожене. Њима се посвећује посебна пажња, али на сајту који смо пронашли, а то је црвена листа, доминирају информације о ареалу и угрожености. Углавном су подаци који се могу наћи и у енциклопедијама своде на изглед, ареал, начин живота (шта једе, да ли спава зими) и евентуално неку занимљивост. Угрожене врсте су углавном - егзотичне, тако да ми немамо ни српске називе за њих, а камоли такве податке. У енциклопедијама, па тако и на Интернету, детаљно се описују мање-више типичне врсте, оне које су честе и релативно доступне људима. Изузеци су кичмењаци, односно сисари највише, јер су они увек актуелни, а и испоставља се да мање-више ми чланке о њима већ имамо, као што је случај са китовима, рецимо (евентуално ови подаци могу да се уграде).
Грешке у чланцима нису невероватне, дешавају се и том проблему нисам дорастао. За интервикије претпостављам да постоје ботови и не разумем зашто је проблем да они одраде посао? Што се тиче Мирослава, знам колико је времена и труда уложио и ја се не бих сложио да је офрље одрадио посао, као што се не бих сложио ни да није неколико (а за наш пројекат много) људи учествовало у реализацији. Конкретно, знам да јесу Зрно, Икс, Бокица и Смирноф и вероватно сам још некога изоставио.
Врло добро се сећам да је Никола хтео да ради птице са потпуно истог сајта и да је тада постигнут консензус (макар на састанку) да се тако и одради. Заправо, преводи станишта, које је Влада урадио, потичу управо од тог доба и од те идеје. Зашто је сада различито и зашто се прича потеже сада, када је о томе причано много времена уназад? И занима ме, пошто је унос обустављен, да ли је ово било обавештење да се неће радити или питање да ли га радити уопште? И да ли ово значи да се размишља о томе да се до сада унесени чланци обришу?--Методичар зговор2а 19:01, 2. фебруар 2010. (CET)

Образложење „кривца“Уреди

Сад сам прешао кроз око 30 чланака што су унесени јуче, првог фебруара 2010. Грешке? Једна.

Кад бих имао тако мали број грешака при ручном писању својих чланака, сматрао бих се савршеним роботом.

Грешке постоје у чланцима који су већ унесени. Међутим, већина чланака нема никаквих грешака. Које постоје, могу се послије исправити, или већ сад. Једноставно ботовски, или кликом на -Уреди- дугме при врху странице.

Процес је био најављиван, јаван и транспарентан од почетка, од љета прошле године. Многобројне дискусије су вођене на Тргу и странама за разговоре. Прије почетка уноса на мјесец дана, 700 пробних чланака је постављено на интернет. Свако је могао да их скине, да сугестије, критике, и пријави грешке на Корисник:Мирослав Ћика/Пијесак2. Грешке су исправљане све вријеме до тада, и касније све до сада. Не само грешке, већ су и разумни приједлози за допуну прихваћени.

Скоро све сугестије које су људи давали сам усвојио. Усвојене су и Николине сугестије, скоро све, које је изнио на мојој страни за разговор. То се може потпуно видјети на чланцима од јуче, а дјеломично и од раније.

Е сад о полу-гу?ичном приступу. Прво озбиљно. О једној животињи или биљци се може увијек нешто додатно написати. Могли би се написати томови. Међутим, наше вријеме и подаци су били ограничени, и подаци су често двосмислени. Такођер, чланци су јасно означени са клица на дну. У чему је онда, проблем? Да ли гу?ица треба бити 70% или 90% пуна? При сваком даљем пуњењу гу?ице, утрошено вријеме се експоненцијално повећава. Ми времена немамо. Имамо једва 50 активних људи.

Нико није никада тврдио да ће чланци бити савршени. То су клице које треба допунити. Никакве тајне ту нема.

Кад бисмо само обраћали пажњу на грешке, најбоље би било да напишемо само један - али сјајан - чланак, и сједимо на њему као квочке на јајима. Тако се слободна енциклопедија не пише. Пише се тако да један почне, други поправи, трећи дода и тако даље. Савршени акти постају само напором многих. Напослијетку, тако, и само тако, уређујемо и наше добре и сјајне чланке.

Тко ништа не ради, ништа не може ни да погријеши.

Тражим да се бот одблокира, и да они који то желе, наставе са радом. --Мирослав Ћика (разговор) 19:37, 2. фебруар 2010. (CET)

Из неког, мени нејасног, разлога се створила фама да је велика фрка блокирати бота. Ја сам мислио да је њих много лакше блокирати него живе кориснике и да ће око тога бити много мање фрке. Само се каже "еј, направио је брљотину овде, погледај може ли се то некако исправити" и идемо даље. -- JustUser  d[-_-]b  21:23, 2. фебруар 2010. (CET)
Ево ја сам прешао последњих 5 чланака унетих 1. фебруара и у 4 сам нашао грешке:
  • Littoridina gaudichaudii: бивше распрострањење није наведено, а постоји међу подацима (Еквадор).
  • Littoraria flammea: бивше распрострањење није наведено, а постоји међу подацима (Кина); бивше станиште није наведено, а постоји међу подацима (обала мора).
  • Litoria lorica: пише да је распрострањена до 100 метара надморске висине, а у подацима стоји да живи и до 1.000 метара.
  • Litoria verreauxii: пише да је распрострањена до 150 метара надморске висине, а у подацима стоји да живи и до 1600 метара.
А осим грешака имам и примедби, на пример да слатководна подручја као станиште нису увезана, или да би за изумрле врсте требало навести у уводу да су изумрле, или да би за живуљке које живе у мочварама по могућству требало написати да живе у мочварама.
Али није највећи проблем ни у овим грешкама, већ у чињеници да начин на који радиш не оставља простора сумњи да ће грешака бити. Схвати ово као професионално мишљење некога ко има вишедеценијско програмерско искуство и коме је јасно зашто је ГОТО лоша идеја: начин на који си припремао масовни унос са собом носи неизбежне и неотклоњиве грешке. Ма колико се трудио да их исправиш, на крају ћеш доћи до стадијума у ком ће исправљање једне грешке изазивати две нове.
(Такође, мени се чини логичним да се већ унети чланци (на хиљаде њих), кад се већ зна да у њима има грешака, унесу поново, ако их људи нису дирали; међутим, ти то не намераваш да урадиш.)
Толико о грешкама, а постоје и проблеми који се тичу додатних података. Јасно је да је додатне податке тешко наћи, па се онда ни не траже (ја сам пробао да тражим податке о популацији али највише што сам нашао су занимљиви подаци о излову рибе на [1] мада и то за мали број врста). Међутим, чак ни кад се нађу ти немаш намеру да их користиш. На пример, ја сам понудио да потражим слике на енглеској Википедији и да се оне аутоматски стављају у чланке, међутим ти то ниси прихватио. Такође, и на самом ИУЦН-у често постоје подаци о томе шта је претња угроженој врсти и шта се предузима у циљу њеног спасења а који би често били употребљиви и за нас. Међутим те податке ти не уносиш.
А као шлаг на торту: "Be afraid, be very afraid". Па, и јесам. Никола (разговор) 21:46, 2. фебруар 2010. (CET)

Nikola, šta znači ovo „на пример да слатководна подручја као станиште нису увезана“? Stvarno nisam shvatio. I moram da te pitam; da li je istina da Miroslav niti jednu tvoju sugestiju nije prihvatio?--Методичар зговор2а 21:59, 2. фебруар 2010. (CET)

Па, претпостављам да би у чланцима требало да стоји нешто попут "Станиште врсте су слатководна подручја." Ти ћеш то боље знати.
Мирослав многе моје сугестије јесте прихватио, али неке и није. Између осталих, није прихватио моје сугестије за додатне податке које бих ја обезбедио. Сугестије ме мање брину од грешака. Никола (разговор) 03:55, 3. фебруар 2010. (CET)

Мој предлог за вики интерлинкове: оставити само ен, па нека други ботови ураде посао. Ен интервики се може и пешке проверити. -- JustUser  d[-_-]b  22:03, 2. фебруар 2010. (CET)


Постоје рецимо две теме овде: Где су сви били кад се о овоме дискутовало? И Да ли су чланци довољно добри?

Где су сви били кад се о овоме дискутовало? је мање битна тема, али ајде укратко. Колико видим од кад је постављен финални пример чланка до почетка масовног уноса је протекло два дана. То је прекратко време да би сви који би желели да реагују реаговали. У расправи о том масовном уносу је поред предлагача учествовало двоје људи. Један од њих је изнео примедбу, исту примедбу коју ја износим (прекратко). Логичан корак, корак који је увек до сад предузиман је да се пре масовног уноса провери какво је расположење заједнице. Да се вођа пројекта трудио да анимира расправу о томе, а сви су се оглушивали на његове покушаје, могао би да буде праведно озлојеђен. Међутим, расправа није текла ни на Трг:Политика (где би била запажена), нити на Масовни уноси, где јој је место, већ је текла на Трг:Ботови, страници која би требало да служи за техничке консултације оператора ботова и стога је они који нису заинтересовани за такве дискусије не прате. Обично кад људи желе да скрену пажњу корисницима на неко дешавање, објаве линк и позив на Тргу. То овде колико знам није учињено. Дакле нису предузети никакви кораци да се види да ли се људи слажу са таквим конкретним (финални производ) масовним уносом. Осим тога, сам Мирослав је приликом једног пређашњег масовног уноса на духовит начин уочио од којих корисника долази највише предлога за унапређење масовног уноса. То су професионални програмери. Никола није свакодневно присутан на ср.вики, али кад му се пошаље порука увек се јави (осим тога као што се може видети он јесте давао предлоге који како он каже нису били усвојени). Ја тих дана нисам стизао да пратим Википедију, али да сам замољен да дам коментар, јавио бих се. Филип који по питању ботова и масовних уноса може да буде гуру свима на овој Википедији јер има искуства више него сви остали заједно је изразио неке своје сумње. Ако радим масовни унос и ако Филип било шта приговори, ја бих се са дужним поштовањем претворио у уво и замолио га да ме посаветује. Такође бих искористио привилегију присутности на пројекту многих других професионалаца који могу да ме посаветују. Сад кад је покренута ова дискусија на Тргу, и кад је потпуно евидентно да око овога не постоји консензус, Мирослав тражи да се и док траје дискусија његов бот одблокира како би могао да настави са радом. Морам да кажем да ме ово мало забрињава јер бот заставица не сме да служи да се нешта око чега не постоји договор провуче на мала врата.

Да ли су чланци довољно добри? Ово је опширно била тема мејла који сам копирао на Трг. Пројекат је припремљен у журби, што се види из претходног пасуса. То се види и из речи вође пројекта: Ми времена немамо. (зашто?) Не може се чекати са нечим, само зато што неко нема времена да прегледа чланке., (откуд толика журба?) Унос је успорен на 100 дневно док радим на неким преправкама у програму. Ипак и овако смо три пута бржи него обично :).

Горе сам набројао 11 ставки које би ови чланци још могли да имају. Зрно је оспорио једну ставку. Претпостављам да су осталих 10 валидне. Могао бих да их наведем још. Чланци су кратки, постоје подаци које бисмо могли да у њих додамо. Остаје још питање да ли те податке можемо да нађемо. Тренутни масовни унос се ослања на један једини сајт! Да ли неко заиста жели да каже да су то једини иоле прихватљиви (сам овај сајт нема баш превише прихватљив формат података, отуд поменуте грешке у овом уносу) подаци које је могуће наћи? То не може да буде тачно. Све и ако на Интернету не може да се нађе више података (а сигурно да може), подаци се могу наћи на неком диску. Кад је рађен унос села, подаци нису постојали на Интернету. Добављени су на диску од институције која их је имала. За разлику од српских села где постоји једна или две институције које се за то занимају, кад су живе врсте у питању постоји на стотине много богатијих институција од којих неке сигурно имају неке базе података. Како им то није примарни интерес оне те податке не објављују на сајту, али такође многима од њих не би био проблем да их доставе за потребе Википедије. Примера ради институције које би могле да имају неке интересантне податке (можда ови појединачни примери немају, али они су управо само примери, таквих институција има још) су ова или ова.

Податке није лако наћи, али их је могуће наћи. Проналажење, анализа и селекција података треба да буду 90% времена уложеног у један масовни унос. После се то све ухакује у питону. За квалитетан масовни унос је потребно шест месеци до годину дана рада. -- Обрадовић Горан (разговор) 00:09, 3. фебруар 2010. (CET)

Ja se slažem sa Miroslavom i mislim da se odblokira što pre. --Alexmilt (разговор) 00:13, 3. фебруар 2010. (CET)

Koliko vidim, ovo je rešena stvar. Ni na jedno moje pitanje nije dat odgovor. Onda me makar zanima šta je predlog? Obustaviti unos i da završimo ili nešto drugo? Ja već objasnih zašto je za ove vrste kritično naći podatke i mogu samo da konstatujem da se to neće promeniti za šest meseci ili godinu dana. Uostalom, probajte sami da nađete.--Методичар зговор2а 00:29, 3. фебруар 2010. (CET)

Ево, питао сам Владу, да ли је могуће наћи још података о живим врстама. Пејстовао сам му ово као пример онога шта се тренутно уноси. Очекивао сам да он одговори типа: да, не, не знам, можда, сигурно, окани ме се, ... Међутим, његов одговор је био: hmmmm [минут паузе] http://www.biodiversitylibrary.org/name/Athearnia_anthonyi Опет ово је само један пример, који само илуструје да подаци постоје. Он представља колекцију дигитализованих књига. Опет можда не сјајан пример, али нађен у року од минут. Ја сам покушао са http://www.biodiversitylibrary.org/name/Canis%20lupus и ту је наравно испљунуо много више тога. Могло би се прегледати пар тих књига, наћи да ли има нека са табеларним подацима, и онда ти подаци искористити.
Ето Дејане, пробао сам да нађем и нашао сам. Тако што сам питао стручњака и он ми је рекао. Без увреде било коме али у овај масовни унос није уложено довољно труда и он није довољно квалитетан. -- Обрадовић Горан (разговор) 01:47, 3. фебруар 2010. (CET)

Даље, опет хвала Влади, пар десетина јавно доступних биоинформатичких база података: http://www.ncbi.nlm.nih.gov/sites/gquery -- Обрадовић Горан (разговор) 02:04, 3. фебруар 2010. (CET)

Даље, ово сам сам нашао: http://www.natureserve.org/explorer/servlet/NatureServe?searchName=Athearnia+anthonyi . Погледајте молим вас која је то количина података! -- Обрадовић Горан (разговор) 02:06, 3. фебруар 2010. (CET)

Članak Littoridina gaudichaudii je bolji kod nas nego u engleskoj wikipediji?! Ako engleskoj ne smeta, ne razumem šta nama smeta? Ako neko ima ideju kako da ga poboljša samo napred. Ne možemo očekivati da na temama koje su tako retke i za koje vrlo mali krug ljudi ima interesa imamo ne znam kakve članke. --Alexmilt (разговор) 02:14, 3. фебруар 2010. (CET)

То што су други радили лоше не треба да буде нама оправдање да и ми радимо лоше. А на основу чега базираш тврдњу да је бољи? Јер је табела већа и јер имамо више празних поднаслова? Оба чланка имају исти број података. Наш наводи да је слатководна, њихов да је живела у Еквадору (остали подаци су исти). Ах да, и њихов чланак је ажурнији иако је генерисан пре три године (они се позивају на IUCN 2.3 а ми се позивамо на IUCN 3.1) (лапсус, наш је ажурнији). Али ово није суштина. Суштина је да чланци могу и морају да буду бољи. Ако неко хоће да их унесе нека уложи потребан труд. -- Обрадовић Горан (разговор) 02:32, 3. фебруар 2010. (CET)
Енглеска Википедија има три милиона чланака и може себи дозволити да има 50.000 клица. Ми не можемо, посебно ако већ не морамо. Никола (разговор) 03:51, 3. фебруар 2010. (CET)
Dobro, članci su tu negde. Ali ako nešto znaš o toj temi, izvolte dopuni. Ako se pojavi neki ekspert u toj oblasti moći će lepo da nastavi da radi. Ako se pojavi neko ko nešto traži moći će da nađe početne podatke. Meni, kada radim na nekoj temi, dosta znači to što je tema otvorena i što su napisane osnovne stvari. I što su drugi loše radili? Wikipedija se grana i širi. Ne mogu svi članci da budu kandidati za izabrane članke.--Alexmilt (разговор) 03:03, 3. фебруар 2010. (CET)
Evo ga super primer: Азијски гепард. Za desetak dana je izrastao u pravi članak. Ko zna još koliko će biti ovakvih geparda kada Miroslav nastavi. --Alexmilt (разговор) 03:11, 3. фебруар 2010. (CET)
Хајде, на страну питање да ли у чланке треба унети додатне податке. Али шта ћемо са грешкама? Зар вам стварно не смета да се у половини чланака унетој на овај начин, а то ће укупно бити трећина чланака на Википедији, налазе грешке?
Азијски гепард је фин чланчић, и приметио сам још и неке, али то је углавном мегафауна и можда 1% масовно унетих чланака. Не можете испратити ни масовни унос који иде овим споријим темпом, а то посебно могу да кажем зато што у осталих 99% чланака грешке нису ни провераване а камоли исправљане. Никола (разговор) 03:51, 3. фебруар 2010. (CET)

Јесу ли те грешке толико неотклоњиве? Мислим, имамо шаблонизован текст, није немогуће ваљда исправити. -- Bojan  Razgovor  06:21, 3. фебруар 2010. (CET)

Наравно да је могуће, само ту постоји пар проблема:
1) Ако је неки човек дирао текст после бота, онда или се морају грешке (ако их човек није приметио) оставити, или прегазити људски рад.
2) Програм за исправљање грешака мора да буде сложенији од програма за унос. Онда није јасно зашто би се ико мучио да га прави кад исто тако може направити и програм за унос.
3) Колико ће времена проћи док неко не направи тај програм за исправљање грешака и колико дуго ће на Википедији стајати погрешни подаци? Никола (разговор) 07:31, 3. фебруар 2010. (CET)

Добро, вероватноћа да је чланак нетачан и да је мењан баш на том месту је још увек мала и тежи нули. Ајде да исправимо те грешке па да наставимо унос. -- Bojan  Razgovor  07:36, 3. фебруар 2010. (CET)

Грешке, и то неретко у великом броју, постоје и у чланцима које су правили људи, а не ботови. Имамо и доста клица које су далеко мањег обима од ових ботовских, па не обустављамо рад оних које их праве. Греке постоје и све се дају исправити. Википедија је ту да пружи корисне информације онима који желе да их добију, па макар имале своја ограничења, оне имају неку садржајну вредност. Боље икакав чланак, него никакав. Стога подржавам наставак масовног уноса. Kvant (разговор) 08:34, 3. фебруар 2010. (CET)
Тачно је да и у чланцима које праве људи има грешака, међутим људи праве по један чланак дневно, тако да те чланке могу прегледати и грешке отклонити други људи. Људи не могу да стигну да отклоне грешке у 500 чланака дневно које би бот уносио, нити су стизали да отклоне грешке ни у 50 чланака дневно које је до сада уносио.
Погрешне информације нису корисне. Никола (разговор) 08:52, 3. фебруар 2010. (CET)
Бојане, На мом последњем прегледу, 40% чланака је имало погрешне податке а 40% недостајуће податке. То није мало и тежи нули, то тежи 100%. И, поновићу се, проблем свих проблема је у томе што начин на који је масовни унос рађен гарантује да ће грешака бити и у будућности. Никола (разговор) 08:52, 3. фебруар 2010. (CET)
Да наставим са претпоследњих 5 чланака унетих 1. фебруара:
  • Litoria rheocola: пише да је распрострањена до 118 метара надморске висине, а у подацима стоји да је распрострањена до 1180 метара.
  • Litoria raniformis: пише да је Аустралија једино познато природно станиште, што је тачно али постоји и вештачко станиште које није наведено; пише да живи у пустињама а у подацима стоји да живи свугде осим у пустињама.
  • Litoria piperata: распрострањење није наведено, а постоји у подацима.
И примедба опште врсте, боље стављати чланке у категорију реда него у категорију рода.
Ови су били бољи, 40% чланака са грешкама, 20% са омашкама. Никола (разговор) 09:10, 3. фебруар 2010. (CET)
Ја сам причао о вероватноћи да има грешке И да је мењано баш на том месту. -- Bojan  Razgovor  09:00, 3. фебруар 2010. (CET)
Па ево рецимо Азијски гепард је мењан баш на том месту. Никола (разговор) 09:10, 3. фебруар 2010. (CET)
Dobro neka 80% clanaka ima gresku i neka je svaki stoti menjan bas tu (a nije, pitanje je da li je svaki 1000-ti) pa dobijemo: 0,8 * 0,01 (0,001) = 0,008 (0,0008) tj 0,8 (0,08%). A vi koji ste menjali, prisetite se koje ste to clanke menjali i proverite. -- Bojan  Razgovor  09:24, 3. фебруар 2010. (CET)
Овдје се може издојити Николина констатација да ми себи не можемо да дозволимо огроман број клица (већ имамо превише). Масовне уносе треба прогресивно планирати, у противном ”случајна страница” постане неупотребљива. Такође је битна перцепција наше публике. Морамо се трудити да пишемо мало дуже чланке, а и да проширујемо постојеће. Не можемо се стално ослањати на ботове и јурити цифре. Постојао је прећутни консензус да пређемо 100 кила чланака, а Мирослав је ту одиграо значајну улогу. Свака част на труду. Мислим да је вријеме да застанемо и сагледамо како сада изгледа ова енциклопедија у глобалу. Кључ цијеле приче би био да покушамо да радимо на унапријеђивању постојећег садржаја, барем наредних шест мјесеци. --Славен Косановић {разговор} 09:17, 3. фебруар 2010. (CET)
Грешке људи су јако бројне и не бивају увек брзо исправљене. Вршећи категоризацију чланака из физике наишао сам на огроман број суштинских грешака и бесмислица које нису исправљане годинама. Тако је гравитација добила масу, светлост престала да се простире кроз вакуум, а Лоренцова сила постала једним од четири основна типа интеракције. Да не набрајам даље... У поређењу са таквим фундаменталним грешкама ове ботовске су ништавне. А и једне и друге пре или касније бивају исправљене. Kvant (разговор) 09:37, 3. фебруар 2010. (CET)
Схватам, али мислим да имаш погрешно разумјевање ботова. Наиме, ботови уносе оно што им задају они који њима управљају, тако да је потенцијал за грешке исти. Иначе, ботови не разумију синтаксу, односно значење ријечи, те нема шансе да касније исправе потенцијалне грешке у том смислу. Једна солуција би била, ископирати сваки чланак у текст фајл, урадити пертинентне исправке и поново пустити бота са опцијом ”замјени цијели садржај”... Прилично напоран посао, односно двоструки посао, без потребе. Друга много једноставнија, корисник који се разумије у дату област исправи и сними чланак. --Славен Косановић {разговор} 09:52, 3. фебруар 2010. (CET)
Разумем начин рада ботова, прилично добро познајем програмирање, али не видим разлику између самих грешака, док мање важним сматрам начин њиховог настанка. Такви ботовски чланци прилично олакшавају посао корисницима. Ако је потенцијал за грешке исти, онда бисмо следећи аналогију требали обуставити и рад људи. А пошто без њега Википедија не би ни постојала ми то не можемо, па стога не бисмо требали да то чинимо ни са ботовима. Просто је неизбежно прављење грешака. Можда треба овај унос успорити како би се лакше и брже могло постићи њихово уклањање, али не и потпуно зауставити. Kvant (разговор) 10:14, 3. фебруар 2010. (CET)
Не могу овде баш да испратим логику... "Имали смо много чланака са суштинским грешкама, те је ОК да имамо још много више чланака са нешто мањим грешкама"?? Никола (разговор) 09:59, 3. фебруар 2010. (CET)
Имамо и даље много са суштинским грешкама и сигурно ћемо имати још много таквих и са много већим. Не обустављамо њихово уношење, а ово са мањим да? У праву си, не треба нам ни једно ни друго, али ако резонујемо на тај начин нећемо имати никакве чланке, или јако мали број. Kvant (разговор) 10:22, 3. фебруар 2010. (CET)
Па наравно да треба упозорити и кориснике који уносе погрешне податке. Разлика је у томе што један корисник може да унесе далеко мањи број чланака са грешкама, него што је то у стању бот, податке којем је такође дао корисник који управља њиме. За једну ноћ бот може да унесе више хиљада чланака, па ти рачунај колико времена и људских ресурса треба да се исправе погрешни подаци у њима, поготово што то послије морају да раде, ко други него ми ”живи” корисници. Масовне уносе треба плански и прогресивно радити, по могућству у консултацији са корисницима којима је дата тема струка. Наравно грешке се могу поткрадати, али треба радити на томе да их буде што мање, нарочито када је у плану 50 000 чланака... --Славен Косановић {разговор} 10:25, 3. фебруар 2010. (CET)
У реду, али тим "живим" корисницима је лакше исправити грешке него писати цео чланак. Слажем се да број уноса треба смањити, али не тако екстремно на нулу. Kvant (разговор) 10:33, 3. фебруар 2010. (CET)
Искуство на овом пројекту ми говори да није, јер нема разлике између корисника који гријеше и ботова који гријеше. :) Наиме, разлика је у количини генерисаног материјала. Ипак, мислим да је много лакше прво исправити грешке, па онда пуштати бота, да касније не би морали да радимо троструки посао. На сваком пројекту Википедије, ботови који гријеше бивају блокирани, јер генеришу огромну количину материјала, који касније треба прегледати и евентуаално кориговати. Ручно је велики смор исправљати толики број клица и потребно је да се доста људи томе посвете. --Славен Косановић {разговор} 10:44, 3. фебруар 2010. (CET)
Грешке људи су јако бројне и не бивају увек брзо исправљене. Вршећи категоризацију чланака из физике наишао сам на огроман број суштинских грешака и бесмислица које нису исправљане годинама. Тако је гравитација добила масу, светлост престала да се простире кроз вакуум, а Лоренцова сила постала једним од четири основна типа интеракције. Да не набрајам даље... У поређењу са таквим фундаменталним грешкама ове ботовске су ништавне. А и једне и друге пре или касније бивају исправљене.-Mislim da je ovo najbolji pokazatelj da kapacitet zajednice nije toliki da radi istovreeno na hiljadama clanaka narocito kada je u pitanju tema interesantna relativno uskom krugu ljudi. Takodje je pomalo besmisleno da nekoliko korisnika koji poznaju biologiju utrose svo svoje vreme posveceno Vikipeidji pregledanju nepreglednog broja clanaka o opskurnim temama nego da rade nesto, slobodno cu reci, pametnije. Bojim se da je zajednica isuvise mala da bi se vreme rasipalo na takve poduhvate. Jos ako na to dodamo mogucnost (na sta ukazuju oni koji poznaju funkcionisanje botova, ja nisma medju njima) da se sav taj posao izbegne pazljivijim planiranjem onda ne vidim nijedan razlog da se ne postupi onako kako je predlozilo nekoliko korisnika: usporiti masovni unos a, po mom misljenju, najbolje resenje je da se sve planirane strnaice generesu izvan glavnog imenskog prostora pa da se zatim prebacuju kada sve bude ispravljeno. --Војвода разговор 17:38, 3. фебруар 2010. (CET)

Algoritmi za resenje problemaУреди

Da li moze ovako da bot ide redom kroz kategoriju Zivotinje i:

  • ako pronadje tekst Врста је по висини распрострањена до xxx метара надморске висине.
    • da ga zameni sa Врста је по висини распрострањена до (tacnih) xxx метара надморске висине. (i Miroslav da ispravi gresku u svom programu)

Izostavljanje rasprostranjenja nije toliko strasno, ipak clanak je klica.-- Bojan  Razgovor  09:24, 3. фебруар 2010. (CET)

То конкретно не може јер податак о надморској висини не постоји у машински читљивом облику. Или да се скроз брише, или да се извуку полусирови подаци па да неко ручно прође кроз њих и издвоји надморску висину (то би требало да иде брзо). А грешку у Мирослављевом програму је из истог разлога немогуће отклонити. Никола (разговор) 09:29, 3. фебруар 2010. (CET)
OK, toliko nisam informisan, ali eto nagovestaja kuda ova rasprava treba da ide. 4 ekrana teksta smo otkucali, a da nismo nasli resenje. -- Bojan  Razgovor  09:38, 3. фебруар 2010. (CET)
Осим тога ни једна ни друга реченица не ваљају синтактички. ”Врста је по висини”... Висини чега? Просјечној висини врсте? :) Хабитат врсте је на надморској висини од хххх-хххх метара, или распрострањеност врсте је на надморској висини хххх метара. И једно и друго много боље. --Славен Косановић {разговор} 09:35, 3. фебруар 2010. (CET)

Људи, бот не може да прави не знам какве чланке. Може само да направи основу. Ја имам предлог да Мирослав сваки дан убаци по 100 чланака а да ми то прегледамо, проверимо, отклонимо грешке и по могућству проширимо.--Alexmilt (разговор) 09:46, 3. фебруар 2010. (CET)

А ја предлажем да се то уради са већ унесеним чланцима, па кад се заврши онда нека се унос настави. Тако ћемо таман видети и којим темпом се могу исправљати унесени чланци. Никола (разговор) 09:51, 3. фебруар 2010. (CET)
Добро, али за то би било добро да нађемо неки принцип да неко проверава чланке. И како ја да знам да ли је чланак проверен или није? Да ли можемо да направимо као у енглеској википедији да се назначе проверени чланци, тако да нема преклапања?--Alexmilt (разговор) 09:53, 3. фебруар 2010. (CET)

Чланци имају пуно грешака (факат). Кажете е, али чланци и имају грешака и кад их праве људи. Тачно али апсурдно, суштина је да чланци које бот генерише не морају да имају грешака али их имају. (Прецизније, не морају да уводе додатне грешке у односу на оне које постоје у подацима - тренутно ми уводимо грешке по стравичном проценту). Потребно је уложити труд да се подаци правилно интерпретирају.

Чланци су кратки (факат). Кажете е, али и [неки] чланци које људи праве су кратки. Тачно али без значаја, суштина је да чланци које бот генерише не морај уда буду кратки али јесу. Речено је да подаци не постоје [сиц]. Подаци су нађени. Потребно је уложити труд да се чланци (значајно) прошире.

Два суштинска проблема, оба су отклоњива, за оба је потребно уложити труд. Реакције на ту једну поруку коју све време понављам су: није могуће уложити труд, е, али погледај како енглеска, е, али погледај овај чланак, па уради онда ти, уложићемо труд касније, Жури нам се, не смарај са расправом, дај да наставимо. То су погрешне реакције. Исправна реакција је: е, хајде да уложимо труд. Сви проблеми се тичу труда, и само трудом се могу решити.

На крају крајева, потпуно је апсурдно рећи: само нека иде унос, исправићемо ми грешке. Осим што се то неће догодити, није ми јасно зашто је боље да више људи уложи енормну количину времена у исправљање података (које опет неће бити савршено) кад програмер може да уложи неупоредиво мање времена и да тих грешака неће ни бити, чланци ће одмах да буду исправни и стравичан труд не мора буде бачен на исправљање сувопарних података већ на битније и забавније ствари. -- Обрадовић Горан (разговор) 11:00, 3. фебруар 2010. (CET)

Daj Gorane, kada tako napises, ispada kao da nikakav trud nije ulozen. :( -- Bojan  Razgovor  13:13, 3. фебруар 2010. (CET)

Ево мог предлога решења: са страница ИУЦН-а неко (ја?) извуче податке тако да буду у машински читљивом облику. То ће да потраје, а за то време други људи могу да траже друге погодне изворе података који би се такође пребацили у машински читљив облик. Кад се дође до коначне колекције података, онда се чланци генеришу са што је више података могуће, и увозе по класама, тако да је лакше отклонити евентуалне проблеме. Никола (разговор) 11:07, 3. фебруар 2010. (CET)

Мислим да је најбоље да, ако већ планирате да уносите чланке са грешкама, њих стављате у не-главни именски простор. Па, како се среди неки чланак, само се премести у ГИП и ствар решена. С друге стране, свакако је вишеструко боље да нема грешака у старту. Тако да ћу се сложити са Гораном, Николом, Славеном и осталима. Хајде да средимо/те ове већ унешене чланке, како се проблеми не би још више гомилали, па тек онда да гледамо да уносимо нове чланке (са више информација, без грешака итд). Грешке умеју да се поткраду и када је реч о човеку и када је реч о боту. Али (!) свесно уношење грешака никада није било прихватљиво. Ако већ знамо да ће да буде грешака, недопустиво је то прећутно пуштати у ГИП. Није циљ повећати број грешака на Википедији, већ их смањити, а уношењем нових грешака се свакако удаљујемо од тог плана. --филип ██ 13:16, 3. фебруар 2010. (CET)

У потпуности подржавам ово што је Филип написао. Или стати са уносом док се ствари не искристалишу и постојеће грешке не исправе или (као у случају глумаца) правити чланке ван ГИП и након што буду прегледани пребацивати их у ГИП. Сећам се масовног уноса са глумцима, колико је то био досадан посао и колико мало корисника је желело на томе да ради. Ако бот буде генерисао мало чланака са грешкама и ако буде више корисника који ће прегледавати сваки чланак пре пребацивања у ГИП (као што је најављено у коментарима изнад) онда не би требало бити проблема око њиховог појављивања у ГИП и повећања броја чланака (ако је то циљ). --micki talk 13:58, 3. фебруар 2010. (CET)

Задњи унос ботомУреди

Ја сам прошао кроз задњи унос чланака Ботом. Мислим да је око 100 чланака ако не и више. Поправио сам шта није било добро, поготову око надморске висине природног становишта, додао шта сам могао, убацио сам слике које су на википедији. Чини ми се да је сада пуно боље. Генерално грешке су се нашле у око 5% чланака. Ајде погледајте да ли је сада задовољавајуће? --Alexmilt (разговор) 16:09, 3. фебруар 2010. (CET)

Svaka čast, Aleks, ali mislim da ne možemo svi imati energije i vremena kao ti u ovom trenutku, a ne možemo ni očekivati da ćeš to ti sam da radiš. Stotinjak članaka dnevno je ipak možda mnogo da se prekontroliše svakog dana, pogotovu što često bude dana da bude totalni drijemež među ekipom, a ovaj masovni unos će da potraje oho-ho i proizvede ola-la članaka, kao što se meni čini, te bi zaista bilo dosta bolje ako bismo dosta tog posla već u pripremi unosa odradili. Šta kažeš Ćiko, kakve planiraš dalje korake? --Дарко Максимовић (разг.) 22:37, 3. фебруар 2010. (CET)

Свака част! Уствари си средио 56 чланака. Перспективе ради, ако би наставио овим темпом, за свих 47.677 чланака би ти требало две године и 4 месеца. Мислим да би било много брже, и без трошења драгоценог људског времена, да се унос уради како треба. Никола (разговор) 02:25, 4. фебруар 2010. (CET)

Ono što Nikola možda malo ironično hoće da kaže je da ćemo uštedjeti mnogo vremena ako neke od očigledno potrebnih ispravki ugradimo već u sam automatizovani proces, i čini mi se da se mnogi od nas slažu. I kad smo radili (su radili) masovne unose za sela, što francuska, što njemačka i srpska i sl. isto ovako smo se dogovarali i sporili, pa dolazili do nekog rješenja. S tim što mislim da je ovaj masovni unos baš koristan, a nisu u pitanju neke beskorisne informacije kakve bi mogle biti, te hajde bre Ćiko prihvati neke od primjedbi i baci se na posao, ako ja mogu nešto pomoći, ili bilo ko drugi, reci, pa da šibamo to. Podaci su korisni, broj članaka će se povećati, popunićemo mnoge praznine, a zoo svijet nam baš fali u mnogim aspektima. --Дарко (разг.) 10:49, 4. фебруар 2010. (CET)

+1 -- Bojan  Razgovor  10:55, 4. фебруар 2010. (CET)
Ја сам хтео да испробам да видим колико грешака, где су те грешке и како да се превазиђу. Тако ваљда падају идеје, можемо сви да станемо и да нападамо то што Мирослав ради са висине и сви ћемо изгледати паметни. Не водим статистику о томе што сам радио али сам прешао све чланке који су унесени задњим уносом бота и то сам ишао један за другим чланком и додатно сам прешао и мањи унос пре тога у коме је било 10-15 чланака. Прешао сам око 120 чланака, ако не и који више. Ти си пребројао оне где сам нешто променио.
Ситуација је оваква: многе сам побољшао тако што сам додао слику и мапу становиштва која се налази на другим википедијама, негде сам убацио неки податак типа није САД него држава Тексас у САД, али то нису биле грешке то сам више радио реда ради, јер ме заинтересовало да видим шта и како. То су ствари које ботом не могу да се среде. Негде ништа нисам радио него сам само прешао преко основних података, јер нигде нема ништа више од тога што је Ботом унесено. Грешке су се појавиле у чланцима где се појављивала надморска висина јер читач бота очигледно то ради са грешком. На неки начин селективно је бирао бројке које су касније убачене и то је убачено делимично типа треба од 800 до 1120 метара а бот убаци само до 112 метара. Како и зашто не улазим, али генерално ту постоји неки проблем и то је увек у одељку станиште'. Жеља је била да се извуче податак више али то не иде.
Елем, шта хоћу рећи, као прво ма какво год поверење да имамо у бот требало би неко да баци поглед шта се тамо дешава. Зар не? Морамо да имамо некакву контролу. Чланци се контролишу, грешке се подкрадају а то се исправља и то тако функционише. Једно решење би било да бот убаци на почетку шаблон где је написано да то није преконтролисано од стране администратора. А да то када неко од нас прегледа, слободно скине. Знам да можда некоме звучи сулудо, али ако неко са претражује википедију види да подаци нису проверени онда ће знати да то треба да провери на линку у референци. Ово би био мој предлог за све остале ботове.
Што се тиче тренутне ситуације било би добро да се уради следеће: Мирослав да избаци учитање бројки у боту, или надморску висину или сл. (ако је прочитао ово што сам написао биће му најјасније од свих нас) тако да би се избегле грешке које се сада појављују. А онда да видимо пар стотина чланака па да видимо да ли је прихватљиво или не.
Да ли је неко имао живаца да схати ово?--Alexmilt (разговор) 12:16, 4. фебруар 2010. (CET)

Ceterum censeo, потребно нам је више података. Нашли смо изворе који сами дају квалитетније и опширније податке него овај извор који се тренутно користи. Тренутно чланци садрже три или четири податка (систематика је један податак јер најнижи ниво једнозначно одређује све остале). Три податка су голи минимум да би се нешта могло назвати енциклопедијским чланком. Дакле то је нај најниже што може. -- Обрадовић Горан (разговор) 15:03, 4. фебруар 2010. (CET)

Dakle, kao što sam rekao, sigurno je da uvek može bolje, ali mi ovde ne pregovaramo o sjajnim člancima, već o klicama. Tri podatka: sistematika, ugroženost i areal već postoje. Dakle, taj deo nije problem, mada bih i ja voleo da ga vidim sa više podataka i pozdravljam da se unese više toga. Proverio sam sajtove koje je naveo Vlada i zaista su korisni. Imamo samo jedan problem; treba pronaći bazu istovetnu onoj koju koristimo da bi postojao smisao. Ne znači nama mnogo ako na crvenoj listi imamo nekoliko vrsta, na drugom sajtu neke druge vrste, a na trećem sajtu treće. E sada, ja ne znam sa botovima i ne znam da li je moguće da u jednom masovnom unosu botovi sa različitih strana unose iste podatke za različite vrste. Ono što me zanima je da li jedan bot može da ide iza drugog i da vrše različite unose? Mnogo toga ne znam i ono što nam je potrebno je da napravimo jednu posebnu stranu posvećenu projektu i da se tu nalaze ideje i poslovi koje treba obaviti. I tu da se uključe baš svi. Informatičari bi precizirali šta zahtevaju od biologa i mi bi to odradili. To podrazumeva i Vladu, jer sam ga uvek pitao za svaki korak i nikad me nije odbio. Ako mi biolozi možemo da radimo zajedno, ne vidim razlog zašto ne mogu i programeri i svi ostali. Mi možemo i drugačije - da obustavimo unos, ali mislim da bi to bila šteta. Međutim i to bi bilo bolje od ove podele u tabore, ironije koja je vrlo uočljiva i stalno prebacivanje loptice sa jedne na druge. Treba da budemo svesni da svi želimo dobro ovom projektu i da uvažavamo napore svakog. Mislim da su me razumeli svi koji treba da me razumeju. Ukoliko ste za to da na neki način krenemo nanovo, predlažem da informatičari daju konkretne ideje na: Википедија:Масовни унос/Врсте. Ovo je zaista najbolje što sam mogao da smislim, ali nije obavezujuće.--Методичар зговор2а 18:26, 4. фебруар 2010. (CET)

Može jedan bot ići za drugim (botom i korisnikom). Situacija je takva da još nije bilo velikih izmena na tim unetim člancima, osim preimenovanja članaka. Ali prvo bi trebalo videti šta ćemo sa postojećim člancima. -- Bojan  Razgovor  18:35, 4. фебруар 2010. (CET)

Образложење „кривца“, други диоУреди

Није истина да су само два дана била утрошена на пријаву грешака. Погледајте детаљно Корисник:Мирослав Ћика/Пијесак2 и линкове на друге унутрашње и вањске веб странице. То што су неки спавали док су ми вриједни људи помагали и давали идеје, ја нисам крив. Како сте тада жмирили на оба ока, сад ваљда можете на једно. Ако немате намјеру помоћи, онда немојте ни другима сметати.

Није истина да унос није најављиван. Погледајте Трг/Разно, Трг/Ботови, моје, Методичареве, и остале странице за разговор итд. Све је ту почевши од љета прошле године. Ништа није сакривено. Тко жели сазнати истину, лако је. Прича је јефтина.

Није истина да 80% чланака има грешке. Недостатак податка није грешка, већ једноставно -одсуство податка-. Да сте пробали да их вадите, видјели бисте колико проблема има. Грешка јест ако пише распрострањена до 100 м, а оно је до нпр. 1000 м. Тко ми је крив кад покушавам да убацим више података. Тај систем углавном ради, али повремено гријеши. Може се лако избацити.

Није истина да је могуће урадити овај унос тако да нема ботовских грешака. Ово није било могуће ни при уносу чисто нумеричких података (пројект НГЦ унос, пројект астероид унос), а камоли при вађењу стрингова из текста. Ви који сте програмери, знате колико је тешко радити са стринговима. Немојте обмањивати људе.

Није истина да је при почетку уноса било грешака. Није било ниједне за коју смо тада знали. То што сте ви преспавали до почетка, ја вам опет нисам крив. Како су онда настале грешке? Неке нисмо уочили на вријеме иако смо дуго гледали. Али већина је настала послије почетка уноса, управо мојим покушајима да изађем у сусрет сваком додатку који ми је неко предложио, да направим чланке бољима. А сада ми се и то узима за зло.

Истина је да нико од оних који сада највише критизирају, није помакао ни мали прст да ми да неки савјет (или изрази макар жељу за формат чланка) док је трајала припрема уноса. И то мјесецима. Ни Горан, ни Никола, ни Филип, ни Кастер. Нико. Ни малим прстом није макао. Е, зато ме ово највише смета.

Истина је да је екстракција података из неформатираног и набацаног текста јако тешка, што зна свако ко је покушао да то некад ради. ИУЦН енглеске чланке су писали људи, имају много грешака, двосмислености, и десетине начина за изражавање једног податка. Примјери:

  1. lives up to 300 m asl...
  2. it can be found from sea level to 400m a.s.l...
  3. maximum height where the species was found is bellow 1,200m a.s.l....
  4. does not occur bellow 2,000 meters above sea level...
  5. ranges between 300-1,200 m....
  6. breeds in forest bellow 2300 m...
  7. height distribution is from 200 to 500m a.s.l....
  8. occurs from sea level to 2000 m...
  9. sea level-1200 m...
  10. итд, итд....

Истина је да за већину података постоје ови проблеми, што чини екстракцију ноћном мором. Пуно пута сам се питао хоћу ли успјети да урадим било шта осим шаблона, уводне реченице, интевикија и линка на ИУЦН. То што сам успио, је потврда моје тврдоглавости, и можда, како све више увиђам, моје лудости.

Истина је да смо тражили боље и свеобухватније податке. Расправа о томе је била и на Тргу, негдје у јулу прошле године. Нисмо их нашли. То што су неки тада спавали, ја нисам крив. Немојте продавати приче и причице о томе да се сада сви ти додатни подаци -које је Горан тек сада пронашао- могу убацити у програм. Не могу. А да то и покушам, то би повукло нове грешке које би опет засметале некима.

Истина је да постоји само један начин да се напише чланак без грешака. Не написати ниједан. У томе предњачимо. И пљувању туђег рада. Лако је туђим ку##ем глогиње млатити.



Е сад мало о могућим рјешењима.

Један од разлога зашто је унос настављан успорено, је баш зато да би се Николине сугестије, једна по једна, уврштавале у програм, и полако тестирале. Како је утврђено - и горе доказано - да неки људи не обраћају пажњу при припреми уноса, овим путем је покушано да се више људи укључи у процес пријаве грешака. Оне би тако (како је горе доказано) једино могле бити пронађене и исправљене.

Како видимо (горе је доказано) да су се наши врли програмери пренули из зимског сна тек недавно, а у стању су да користе аутоматске алатке за проналажење грешака (греп итд.), то предлажем слиједеће:

Замрзавање чланака са подацима и форматом који постоји од дана 1. фебруара 2010. Никакво додавање додатних жеља ми није прихватљиво, осим ако није тривијално лако за извођење. Зато, што је то иначе отварање боце без дна. Гдје би ту био крај? Ја ћу, када будем спреман, поставити на онај исти линк - да, на онај исти линк на Гугл Сајтсу (види Корисник:Мирослав Ћика/Пијесак2) који постоји још од средине децембра прошле године са пробним чланцима, хвала лијепо - поставити десет хиљада (10 000) пробних чланака. Онда, ко год жели нека скине чланке и прегледа их. Грешке пријавити на Трг-Ботови, да буду свима на видјелу, једну по једну, како су биле пријављене раније на фамозној страници Пијесак2 коју нико од велеуважене господе критичара није раније посјетио. Када отклоним све пријављене грешке, поставићу поново 10000 истих побољшаних чланака на интернет, на увид и на преглед свима. Ово ће се понављати све док год не буде било грешака, паднем мртав поред тастатуре, или будем изабран за премијера Канаде. Чему сам ближи, трипут погађај.

Што се тиче корекције грешака у чланцима који су већ унесени. То преузимам на себе, по окончању уноса. Не могу радити унапријед и унатраг у исто вријеме. Они који желе су добродошли да на томе раде. Ако не то ћу средити сам. Послије уноса.



Моје виђење ове википедије и српског језика је не на 29. мјесту, већ у првих 20. У том великом плану, овај унос је само један од многобројних корака. Дакле, нећу се зауставити на овоме, већ планирам да наставим - са непрекидном серијом уноса са разним темама, да дођемо до великог циља: Да све важније теме имају чланке на нашој википедији. Енциклопедијска покривеност ће бити омогућена уносима разних величина из најразличитијих подручја. Идеја имам јако пуно.

Ми то можемо постићи, али потребна ми је добра воља и вријеме. И не само моја добра воља, како видимо. Да бих то постигао, не могу трошити превише времена на једну тему, колико год она била значајна. Ја сам ипак само један човјек, а желим пуно да урадим. Мој циљ је 300-400 хиљада чланака, не за 40 година, већ сада и одмах, за годину-двије-три. И мала клица је увијек боља од ничега. Много је лакше допунити и исправити за некога ко је почетник на википедији, него научити вики синтаксу, ек-ијек правила, подесити тастатуру за не-аски, да му чланак не би био обрисан. Прошао сам тим путем и знам како је.

Програмерима дајем изазов: почните рад на сопственим масовним уносима. Докажите да сте бољи од мене, то и није нарочито тешко, јер сам осредњи самоуки програмер. Прича је јефтина. Никола, GOTO команда у Пајтону не постоји. Занимљиво је да то ниси знао као искусан програмер :)

Ми имамо 50 активних корисника. 300 000 чланака се никада неће само ручно написати. Једино ботови су одговор на наш мањак људи.

А онда се можда пробуди и српство успавано. Тко нас мрзи, нек нас мрзи још више, а тко нас воли, вољеће нас још више. Покажимо свима шта смо у стању, и да никога не оставимо равнодушним.

Само овај велики приступ и визија може да нас одведе ка великом циљу. Мени ништа мање није прихватљиво. Или ћемо радити право за напредак нашег рода, или боље да се не срамотимо сједећи у мраку балканске крчме иза Турака и Арапа. Ако будем спријечен, биће ми изузетно жао, и мораћу наставити рад негдје другдје, гдје ће бити мање навлачења око тричарија. Али, сам планине не могу да помјерим. Треба ми, као минимум, прешутна дозвола за рад.

Поздрав свима. Молим вас да се изјасните о мом приједлогу рјешења. Хвала.--Мирослав Ћика (разговор) 18:41, 4. фебруар 2010. (CET)

OK, nemoj ni ti prihvatati ovako lično. Možda je bolje obrisati prvo sve rečenice iz članaka Врста је по висини распрострањена до xxx метара надморске висине? nego da proveravaš jedan po jedan članak? -- Bojan  Razgovor  18:52, 4. фебруар 2010. (CET)

Ћику за председник! Ја хоћу да поправљам досадашње чланке а Ћика да настави унос. Ајде немојте више да кочите него да се бацимо на посао.--Alexmilt (разговор) 18:55, 4. фебруар 2010. (CET)

UnosУреди

Na stranici 44 arhive nalazi se predjasnja rasprava. Stranica je arhivirana da bi se prekinula rasprava koja nigde nije vodila. Medjutim, tamo ima stvari koja su ponudjena kao resenja. Tu pricu bi trebalo nastaviti na Википедија:Масовни унос/Врсте. Hvala na razumevanju. -- Bojan  Razgovor  19:56, 4. фебруар 2010. (CET)

Мислим да не би требало да архивираш активне дискусије. Искрено, не интересује ме колико је тема била контроверзна или да ли је тема по твом мишљењу негде водила. Мислим да ствари не треба гурати испод тепиха (или пребацивати дискусију на друго место без јасног контекста). Желео сам да одговорим на Ћикин "велики пост", али без контекста то нема смисла, тако да нећу ништа рећи. --филип ██ 21:20, 4. фебруар 2010. (CET)
Убаци ми се Филип, али мој текст се не разликује пуно ...
Није добро уводити праксу архивирања страна док било каква дискусија тече. Може се блокорати због троловања, избјегавати те исте хранити, упозорити због форумаштва или сл. - али пресијецање дискусије овим путем дефинитивно није добра пракса. И то без обзира на којем нивоу је нечији стресометар тренутно. Поз, --Kašter (разговор) 21:27, 4. фебруар 2010. (CET)
Делим исто мишљење, Ћика је изнео коментар од 15.000 бајтова, а исти је непуних сат времена касније архивиран. Не би смело тако нешто да се дешава, може се схватити да је намера намерно провоцирање корисника. SmirnofLeary (разговор) 21:39, 4. фебруар 2010. (CET)

Moj cilj je i bio da se ne odgovoara, vec da se radi. -- Bojan  Razgovor  01:35, 5. фебруар 2010. (CET)

Образложење „кривца“, други диоУреди

Није истина да су само два дана била утрошена на пријаву грешака. Погледајте детаљно Корисник:Мирослав Ћика/Пијесак2 и линкове на друге унутрашње и вањске веб странице. То што су неки спавали док су ми вриједни људи помагали и давали идеје, ја нисам крив. Како сте тада жмирили на оба ока, сад ваљда можете на једно. Ако немате намјеру помоћи, онда немојте ни другима сметати.

Није истина да унос није најављиван. Погледајте Трг/Разно, Трг/Ботови, моје, Методичареве, и остале странице за разговор итд. Све је ту почевши од љета прошле године. Ништа није сакривено. Тко жели сазнати истину, лако је. Прича је јефтина.

Није истина да 80% чланака има грешке. Недостатак податка није грешка, већ једноставно -одсуство податка-. Да сте пробали да их вадите, видјели бисте колико проблема има. Грешка јест ако пише распрострањена до 100 м, а оно је до нпр. 1000 м. Тко ми је крив кад покушавам да убацим више података. Тај систем углавном ради, али повремено гријеши. Може се лако избацити.

Није истина да је могуће урадити овај унос тако да нема ботовских грешака. Ово није било могуће ни при уносу чисто нумеричких података (пројект НГЦ унос, пројект астероид унос), а камоли при вађењу стрингова из текста. Ви који сте програмери, знате колико је тешко радити са стринговима. Немојте обмањивати људе.

Није истина да је при почетку уноса било грешака. Није било ниједне за коју смо тада знали. То што сте ви преспавали до почетка, ја вам опет нисам крив. Како су онда настале грешке? Неке нисмо уочили на вријеме иако смо дуго гледали. Али већина је настала послије почетка уноса, управо мојим покушајима да изађем у сусрет сваком додатку који ми је неко предложио, да направим чланке бољима. А сада ми се и то узима за зло.

Истина је да нико од оних који сада највише критизирају, није помакао ни мали прст да ми да неки савјет (или изрази макар жељу за формат чланка) док је трајала припрема уноса. И то мјесецима. Ни Горан, ни Никола, ни Филип, ни Кастер. Нико. Ни малим прстом није макао. Е, зато ме ово највише смета.

Истина је да је екстракција података из неформатираног и набацаног текста јако тешка, што зна свако ко је покушао да то некад ради. ИУЦН енглеске чланке су писали људи, имају много грешака, двосмислености, и десетине начина за изражавање једног податка. Примјери:

  1. lives up to 300 m asl...
  2. it can be found from sea level to 400m a.s.l...
  3. maximum height where the species was found is bellow 1,200m a.s.l....
  4. does not occur bellow 2,000 meters above sea level...
  5. ranges between 300-1,200 m....
  6. breeds in forest bellow 2300 m...
  7. height distribution is from 200 to 500m a.s.l....
  8. occurs from sea level to 2000 m...
  9. sea level-1200 m...
  10. итд, итд....

Истина је да за већину података постоје ови проблеми, што чини екстракцију ноћном мором. Пуно пута сам се питао хоћу ли успјети да урадим било шта осим шаблона, уводне реченице, интевикија и линка на ИУЦН. То што сам успио, је потврда моје тврдоглавости, и можда, како све више увиђам, моје лудости.

Истина је да смо тражили боље и свеобухватније податке. Расправа о томе је била и на Тргу, негдје у јулу прошле године. Нисмо их нашли. То што су неки тада спавали, ја нисам крив. Немојте продавати приче и причице о томе да се сада сви ти додатни подаци -које је Горан тек сада пронашао- могу убацити у програм. Не могу. А да то и покушам, то би повукло нове грешке које би опет засметале некима.

Истина је да постоји само један начин да се напише чланак без грешака. Не написати ниједан. У томе предњачимо. И пљувању туђег рада. Лако је туђим ку##ем глогиње млатити.



Е сад мало о могућим рјешењима.

Један од разлога зашто је унос настављан успорено, је баш зато да би се Николине сугестије, једна по једна, уврштавале у програм, и полако тестирале. Како је утврђено - и горе доказано - да неки људи не обраћају пажњу при припреми уноса, овим путем је покушано да се више људи укључи у процес пријаве грешака. Оне би тако (како је горе доказано) једино могле бити пронађене и исправљене.

Како видимо (горе је доказано) да су се наши врли програмери пренули из зимског сна тек недавно, а у стању су да користе аутоматске алатке за проналажење грешака (греп итд.), то предлажем слиједеће:

Замрзавање чланака са подацима и форматом који постоји од дана 1. фебруара 2010. Никакво додавање додатних жеља ми није прихватљиво, осим ако није тривијално лако за извођење. Зато, што је то иначе отварање боце без дна. Гдје би ту био крај? Ја ћу, када будем спреман, поставити на онај исти линк - да, на онај исти линк на Гугл Сајтсу (види Корисник:Мирослав Ћика/Пијесак2) који постоји још од средине децембра прошле године са пробним чланцима, хвала лијепо - поставити десет хиљада (10 000) пробних чланака. Онда, ко год жели нека скине чланке и прегледа их. Грешке пријавити на Трг-Ботови, да буду свима на видјелу, једну по једну, како су биле пријављене раније на фамозној страници Пијесак2 коју нико од велеуважене господе критичара није раније посјетио. Када отклоним све пријављене грешке, поставићу поново 10000 истих побољшаних чланака на интернет, на увид и на преглед свима. Ово ће се понављати све док год не буде било грешака, паднем мртав поред тастатуре, или будем изабран за премијера Канаде. Чему сам ближи, трипут погађај.

Што се тиче корекције грешака у чланцима који су већ унесени. То преузимам на себе, по окончању уноса. Не могу радити унапријед и унатраг у исто вријеме. Они који желе су добродошли да на томе раде. Ако не то ћу средити сам. Послије уноса.



Моје виђење ове википедије и српског језика је не на 29. мјесту, већ у првих 20. У том великом плану, овај унос је само један од многобројних корака. Дакле, нећу се зауставити на овоме, већ планирам да наставим - са непрекидном серијом уноса са разним темама, да дођемо до великог циља: Да све важније теме имају чланке на нашој википедији. Енциклопедијска покривеност ће бити омогућена уносима разних величина из најразличитијих подручја. Идеја имам јако пуно.

Ми то можемо постићи, али потребна ми је добра воља и вријеме. И не само моја добра воља, како видимо. Да бих то постигао, не могу трошити превише времена на једну тему, колико год она била значајна. Ја сам ипак само један човјек, а желим пуно да урадим. Мој циљ је 300-400 хиљада чланака, не за 40 година, већ сада и одмах, за годину-двије-три. И мала клица је увијек боља од ничега. Много је лакше допунити и исправити за некога ко је почетник на википедији, него научити вики синтаксу, ек-ијек правила, подесити тастатуру за не-аски, да му чланак не би био обрисан. Прошао сам тим путем и знам како је.

Програмерима дајем изазов: почните рад на сопственим масовним уносима. Докажите да сте бољи од мене, то и није нарочито тешко, јер сам осредњи самоуки програмер. Прича је јефтина. Никола, GOTO команда у Пајтону не постоји. Занимљиво је да то ниси знао као искусан програмер :)

Ми имамо 50 активних корисника. 300 000 чланака се никада неће само ручно написати. Једино ботови су одговор на наш мањак људи.

А онда се можда пробуди и српство успавано. Тко нас мрзи, нек нас мрзи још више, а тко нас воли, вољеће нас још више. Покажимо свима шта смо у стању, и да никога не оставимо равнодушним.

Само овај велики приступ и визија може да нас одведе ка великом циљу. Мени ништа мање није прихватљиво. Или ћемо радити право за напредак нашег рода, или боље да се не срамотимо сједећи у мраку балканске крчме иза Турака и Арапа. Ако будем спријечен, биће ми изузетно жао, и мораћу наставити рад негдје другдје, гдје ће бити мање навлачења око тричарија. Али, сам планине не могу да помјерим. Треба ми, као минимум, прешутна дозвола за рад.

Поздрав свима. Молим вас да се изјасните о мом приједлогу рјешења. Хвала.--Мирослав Ћика (разговор) 18:41, 4. фебруар 2010. (CET)

Ok, svakako nije trebalo arhivirati diskusiju tom brzinom, mada je to već postala praksa na Njikipediji, definitivno nije prvi put i Bokica to nije jedini odradio. Prosto takva praksa ne bi trebalo da se dešava uopšte. Između ostalog, pokazuje i pomanjkanje želje da se stvari rade dogovorno, a i da se ne lažemo, iritira kada neko preseče po sopstvenom nahođenju (uzgred, na šta nema pravo-apsolutno se slažem). Međutim, verujem da je Bokica ovaj put imao praktičnu nameru da usmeri diskusiju ka konkretnom i to mogu da pozdravim. Rekli smo čini mi se, sve šta smo imali, pri čemu ne mogu da tvrdim da su svi bili na visini korektnosti, ali bože moj, uvek se neko izdvoji i po tom pitanju. Mislim da je vreme da se sada ljudi koji su dali oštre kritike ne povuku, jer se nadam da kritike nisu upućene radi kritika već radi toga da nešto rešimo. Pozivam sve da se prebacimo na stranu koju je Bokica otvorio, da konkretizujemo ko šta želi i šta je od toga realno ostvarivo i da ja više odem u tu pemziju.  Možda ne bi bilo loše napraviti pododeljke „zahtevi za biologe“, „zadaci za botove“ i sl. Pozdravljam i to da se tamo nađe Ćikin i Filipov predlog.--Методичар зговор2а 22:28, 4. фебруар 2010. (CET)

Квантитет по сваку цену на уштрб квалитета. Зато ја више не пишем овде. Као уосталом и многи други. Ти си, Мирославе, зацртао себи немогући циљ (300 000 чланака одмах и сад) који хоћеш пошто пото да оствариш, без обзира на цену. А цена је превисока - гомила бедних клица са гомилом грешака. Мислиш да ћеш тако привући српске читаоце? Мислиш да ћеш тиме подићи углед српској Википедији? Бројем чланака који ничему не служе? Па свако иоле паметан ће отићи да неки други језик да прочита чланак иако осредњи, али са извесним смислом, референцама и без грешака. Углед се стиче квалитетом, а не квантитетом који ничему не служи. Апсолутно се слажем с Гораном и Филипом, ако већ радите те масовне уносе (против којих сам ја била одувек, ал ајде), онда их барем припремите како ваља, па да то мало података који се унесу буду тачни и информативни, а не да за сваким масовним уносом мора да иде чета људи и да поправља брљотине зато што се програмеру журило и нема времена да уради оно што је намерачио како треба. Ако не можеш да урадиш посао како треба из било ког разлога, онда га боље немој ни започињати. За ових неколико година које сам провела овде, видела све и свашта, доживела све и свашта, схватла сам да је једна ствар сурово тачна: нико не воли да поправља туђе брље, свако радије отвори нову страницу и почне да пише "из почетка" (част изузецима, али такви се могу набројати на прсте једне руке). Остави се празног патриотизма и ако заиста желиш да будеш користан овој Википедији, припреми тај масовни унос како треба. Можда не би било лоше да прихватиш предлог који је неко горе дао (не сећам се више ко), и да поделиш тај унос на врсте, па почни на пример са сисарима, или птицама, или шта већ, део по део, па колико стигнеш. Не морају се унети СВЕ животиње, нити СВЕ биљке, нити СВЕ звезде. Довољне су поједине групе, али да оно што буде било унесено, буде људски урађено, без потребе да се поправља. --Јагода  испеци па реци 22:39, 4. фебруар 2010. (CET)
Ја нисам видио никакав конкретан приједлог овдје, како би ти чланци били бољи, осим идемо да направимо сензацију са 300 000 чланака. То може да уради свако од нас ко се разумије у ботове. Није неки проблем набити цифру. Оно што нама треба је садржајност. Људи долазе на енциклопедију да нађу информације, а не обичне податке. Надам се да се разлика између информација и података схвата. Не стоји да је почетницима тешко да овладају са пар правила и да науче да подесе свој рачунар на српску ћирилици/латиницу, не мијешају јек-ек, јер је то императив за уређивање ове енциклопедије, као, уосталом, сваког писања на српском језику. Ученички радови за школу у Србији или Српској, нису прихватљиви без испуњавања ових услова. Испуњавање тих услова је императив за писменост на српском језику. Импресивно је и што имамо преко 100 кила чланака, међутим нисмо постигли неки значајан углед на српском говорном подручју. Зашто? Зато што велики број тих чланака нема довољно добрих информација, као рецимо класичне енциклопедије. Истина, имамо чланака који су бољи од чланака које се могу срести у класичним енциклопедијама на српском језику, као што је истина да имамо чланака који ништа не ваљају. Читаоци, односно публика, није глупа. Можемо нафурати 1 000 000 чланака, али ако ти чланци нису приближно добри као они у класичним енциклопедијама, нисмо урадили ништа. Први задатак око овог питања са врстама би био да направимо колико толико добре чланке о великим породицима тих врста, па тек онда да прогресивно убацујемо потпородице и саме врсте. Фино је што имате велике идеје о ботовима који рјешавају проблем са мањком активних корисника, али је стварност рада на једној енциклопедији нешто што није у складу са тим великим идејама. Википедија захтјева тимски рад и маркирање задатака прогресивно, не напрасно, јер се лако изгуби компас. --Славен Косановић {разговор} 09:11, 5. фебруар 2010. (CET)

Чисто да се подсетим да се ова страница зове Википолитика и намењена је да се бави односима у заједници. Уопштену причу о уносима наставите на Разном, а конкретне ствари око овог уноса на Википедија:Масовни унос/Врсте. -- Bojan  Razgovor  09:20, 5. фебруар 2010. (CET)

Масовни уноси се итекако тичу википолитике и односа у заједници. Немам намјеру да коментаршем цијелу причу на некој страници на којој иста не одвија. Ми морамо да установимо једну политику за масовне уносе, поготово када узрокују контраверзе. --Славен Косановић {разговор} 09:29, 5. фебруар 2010. (CET)
Не, не тичу се. -- Bojan  Razgovor  09:30, 5. фебруар 2010. (CET)
Ако нешто утиче на однос људи према пројекту и изазива контраверзе, онда се свакако тиче односа у заједници и википолитике. Ако радим нешто што не наилази на одобрављање велике већине, онда то нешто утиче на односе у заједници и треба о томе поразговарати. Најбоље мјесто за то је Трг. Сада ти опет можеш да ми контрираш, али објективно, масовни уноси утичу на однос корисника према пројекту, а самим тиме и на односе у заједници. Није ово први пут да имамо дискусије на Тргу о масовним уносима. --Славен Косановић {разговор} 09:40, 5. фебруар 2010. (CET)

Ovo stranica se pretvorila u opstu raspravu o mas-unosima i odstupila od svoje teme. A poznajuci vas i gledajuci prethodna dva dana, vi mozete do prekosutra da filozofirate i optuzujete. A dotle ce problem stajati. -- Bojan  Razgovor  10:07, 5. фебруар 2010. (CET)

A što si ti uopšte premeštao raspravu? To iznenadno arhivisanje rasprave i premeštanje na neku tamo drugu stranu nije ništa drugo do sabotaža iste, a ti imaš običaj to da radiš, te bi mogao da se barem potrudiš da se oslobodiš te ružne navike, jer ne verujem da ti je cilj da sabotiraš. Kakve veze ima gde se vodi rasprava, ako se vodi? Nek se vodi tamo gde je započeta, i nek se ne arhiviraju pisanija mlađa od tri dana (barem), kako bi se dalo ljudima vremena da ih pročitaju. --Јагода  испеци па реци 10:30, 5. фебруар 2010. (CET)

Mozete procitati, samo je signal da neko ozbiljan neutralan misli da ste preterali. I dosta bre vise. -- Bojan  Razgovor  10:42, 5. фебруар 2010. (CET)

Hm, ti to ozbiljno i neutralno misliš da si ti ozbiljan i neutralan, pa samim tim da imaš za pravo da odlučiš kad je neko preterao? Zanimljivo. Ako je nešto arhivirano, onda je sakriveno. Ne verujem da ikome pada na pamet da redovno pregleda arhive. Osim toga, tvoja akcija je ovde odmah naišla na neodobravanje apsolutno SVIH strana. Stoga, budi ozbiljan i neutralan, pa priznaj da si pogrešio. Neće ti pasti kruna s glave. --Јагода  испеци па реци 10:46, 5. фебруар 2010. (CET)

Da li sam pogresio nije ni bitno, bitno je da se jedna ista stvar ponavlja vec tri dana, a posle mog n-tog poziva na rad, tamo skoro da nicega nema, a ova stranica je opet narasla na dva-tri ekrana. Programerski receno, upadate u beskonacnu petlju, iznova i iznova. -- Bojan  Razgovor  15:39, 5. фебруар 2010. (CET)

Бојане, није никакво филозофирање изнијети примједбе на масовни унос којим се претендује нешто што смо већ виђали на овој Википедији од самих почетака. Жељу појединаца да импресионирају сами себе, употребом бота. Сама ријеч филозофирање код нас има један омаложавајући карактер, те је ја не бих олако користио. Овакве грандиозне идеје о милионима чланака су имали још неки појединци у прошлости. Више људи је овдје предложило да се иде прогресивно, да се чланци који ће се уносити још осмисле, да не буде да уносимо обичне каталошке податке. Да се крене од општег ка специфичном и да се заборави на милионе чланака, него да се концетрише на суштину, односно садржај. Википедија је енциклопедија, а не каталог. То не значи да сада сви ми треба да се укључимо у припрему тих чланака, није тако нешто рађено ни раније. Корисници који су заинтересовани, нека се организују у тим, направе план, коригују шта треба кориговати, консултују се за евентуалне проблеме са онима који се разумију у биологију и слично. Тргови и служе за дебату о различитим питањима на свим Википедијама, односно то су мјеста гдје сви ми као појединци међусобно размијењујемо мишљења о пројекту, било да се ради о општим стварима, било о конкретним. Свакако, један масовни унос који претендује да измјени слику пројекта има значајан општи карактер, поред специфичности самог масовног уноса, те заслужује да се посљедице сагледају из више углова, општих и специфичних. --Славен Косановић {разговор} 10:51, 5. фебруар 2010. (CET)
Иѕвињавам се због оштрине. -- Bojan  Razgovor  16:56, 5. фебруар 2010. (CET)

Људи, а шта кажете да обришемо све чланке који не задовољавају нека oсновна мерила и оставимо само изванредне чланке. А онда лепо уређујемо само то и сваке недеље бирамо по једну такву тему и лепо опишемо, додамо слике, нађемо по стотину референци, не рачунамо чланке без 100кб и 12 слика? Мислим да бисмо били убедљиво најбоља википедија по мишљењу многих. Ако чланак задовољава минимум потребних информација да буде чланак онда је то чланак, није изванредан али је чланак. Све википедије су пуне тога. Да ли то умањује неки значај? Ако неко има жељу и идеју да напише неки чланак о некој теми да ли ће му сметати то што има толики број чланака о животињском свету? За неколико година биће главна проблематика како да се ти чланци продубе и онда ће се поново са сличним кампањама, а дотле ће настати велики број нових извора. Стигли смо до момента када бот нема грешака. Шта даље? --Alexmilt (разговор) 11:24, 5. фебруар 2010. (CET)

Шта да ти кажем. Има нас који сматрамо да би требало обрисати сваки чланак који не испуњава основне услове, а то је да макар има тачну дефиницију појма који обрађује, као и свести сваки чланак у којем стоји погрешан садржај само на информације које су тачне. Ако кроз тај процес на крају ништа не остане, обрисати. Али пошто сам свјестан да за тако нешто не постоји подршка у заједници, нисам се прихватио таквог посла, иако чврсто стојим иза тврдње да је оно што даје углед неком пројекту квалитет информација, а не количина бајтова у једном чланку или њихов број. Какве користи од неког чланка који или нема довољно најосновнијих информација, или оне које има стоје погрешне? Никакве. Постави себе у ситуацију некога ко тражи информације о нечему, а испадне да је оно што је нашао, неупотребљиво. Имамо чланака који годинама стоје са погрешни информацијама и нико их није исправио, јер је потребно да се да више околности да би до тога дошло: да се корисник који налети на њих разумије у тему, (осим што може другдје да провјери да је нешто нетачно, јер се не ради увијек о очигледним сувопараним подацима); као и да има жељу и вољу да се позабави чланком, или можда серијом чланака. Осим тога нико вам није рекао да скроз одустанете, него да се мало више позабавите цијелом причом (садржајем у тим чланцима), идете прогресивно, тимски и плански, те заборавите на стотине хиљада чланака за годину дана или мање. --Славен Косановић {разговор} 12:18, 5. фебруар 2010. (CET)

U cilju toga da nas zanima i kvantitet i kvalitet, predlažem da makar uradimo nešto po pitanju već unesenih članaka, kojima očigledno nekoliko ljudi nešto zamera. Bokica je u pravu što se tiče toga da ova rasprava ne daje rezultate, već nastavljamo ono što smo započeli - argumente za i protiv masovnih unosa. Naravno da ćemo pročitati mnogo mudrih misli, ali ništa nećemo rešiti. Meni je potpuno nebitno gde ćemo o čemu pričati i najiskrenije, vaše insistiranje da na svakoj strani mora da postoji tačno određena tema me prilično podseća na nastavničko veće; mnogo formalnosti, malo konkretnog. Zato podržavam Aleksovo pitanje: šta dalje? Ako je poenta da su ljudi zaustavili bota, objasnili se, dali zamerke (uz najbolju volju, neke su prilično na staklenim nožicama, ali ajde, zamerke su) i rekli doviđenja, što znači da je zaustavljanje unosa bio cilj, dajte izjasnite se tako, da više prekinemo ovo, jer je postalo mučno i iscrpljujuće. Miroslav je imao najbolju nameru, ali poput drugih ljudi koji su tu radili, vremenom će prihvatiti situaciju, radićemo drugačije i što je najznačajnije neke stvari će postati jasnije na Njikipediji. Baš kako i treba da bude.--Методичар зговор2а 12:24, 5. фебруар 2010. (CET)

Стварно већина нас не заслужује да нам се каже да нисмо рекли ништа конкретно овдје. Имали сте замјерке на грешке од стране корисника који су те чланке прегледали. Такође замјерке на циљ и снове о великој српској Википедији преко чланака са минималним садржајем, који практично ништа не говори о тим врстама. Ја имам једну енциклопедију врста и када упоредим те чланке са првом реченицом у сваком чланку у њој, очигледно да ови наши не личе ни на шта. Хајде да сви себи задамо циљ да ботом убацимо хиљаде чланака сваки мјесец?! Ја такође могу, без проблема, али ти чланци такође неће личити ни на шта. Такође сам дао приједлог да кренете од општег ка специфичном, прво велике породице, па потпородице, па врсте. Можете и измјешати редослијед како хоћете, с тим да будемо сигурни да ти чланци имају неки смисао, односно макар мало смисленији садржај, те да се међусобно повезују у смислу садржаја, не само преко повезница. --Славен Косановић {разговор} 12:38, 5. фебруар 2010. (CET)
Сугерисано је на грешке. Сада смо дошли у фазу када грешака више нема, што значи да тај аргумент више не постоји. О укусима и сновима не требамо да расправљамо јер је то све субјективно. Нека свако ради оно шта жели док год је то у оквиру википедије, али немојмо да кочимо једни друге тиме што се наши укуси разликују и имамо различите циљеве. Овде је главни проблем: Да ли ови чланци имају грешака? Или сметају? Која википедијина правила крше? Да ли неко може да се позове на неко википедијино правило и да каже то је прекршено па зато не може? Ја сам наишао на десет чланака које бих најрадије избацио јер сматрам да су субјективни и циљани, али се трудим да их побољшам и објективизујем а не да их обришем. Такође сам наилазио на чланке које неки чланови википедије минирају и праве их бесмисленим, али добро, за то проналазе адекватне бирократске начине. Сада улазимо у фазу када су сви услови које википедија тражи испуњени али многи имају своје укусе!! --Alexmilt (разговор) 13:30, 5. фебруар 2010. (CET)
Не разумем твоје резоновање. Нико није рекао (ако се добро сећам) да чланке треба брисати. Само их треба исправити и евентуално допунити доступним подацима. --филип ██ 13:41, 5. фебруар 2010. (CET)
Па нико није рекао да не треба брисати, али ако се не дозвољава унос чланака који задовољавају минимум, онда ваљда треба прегледати чланке који већ постоје па селектовати и рашчистити са чланцима истог нивоа. То произилази из овог начина размишљања јер је нешто "енциклопедијски" а друго није, мада не знамо тачну дефиницију тога. Грешка која се појављивала је уочена и она се неће више понављати. Ако се појави нека следећа онда то можемо да нађемо при следећим мањим уносима. А што се тиче допуњавања мораш са Мирославом да поразговараш али треба да се нађе адекватан извор, међутим таквог нема. Постоји неколико предложених који нису адекватни за ботовски унос. --Alexmilt (разговор) 14:12, 5. фебруар 2010. (CET)

Славене, не постојимо ми и ви. Сви смо на истој страни и сви желимо исто иако различито размишљамо. Нисам рекао да нико ништа конкретно није рекао, већ да нам ова расправа ништа није решила. Што се дедуктивног или индуктивног прилаза тиче, у методици, па тако верујем и у овом (енциклопедијском) раду, то је ствар одлуке која не осигурава квалитет. Можемо ми да кренемо и од реда, класе, породице, Јанка, Марка, али то су засебни чланци и ништа нам не значи за саме врсте, осим што се шаблон (таксобокс) неће црвенити. И даље садржај повезанији бити неће.--Методичар зговор2а 13:19, 5. фебруар 2010. (CET)

Дакле, ОК, можемо да наставимо са филозофирањем, али то не води ничему. Ту се ваљда слажемо. Значи, тражи се да се крене са конкретним реализацијама. Људи који су дали замерке су дали и неке релативно конкретне примере како би се бот могао исправити. Лично сам вољан да учествујем у причама реализације бота (дакле, технички аспекти) са Мирославом и осталим заинтересованим странама, како бисмо максимизовали крајњи квалитет. Стога, нудим своју помоћ у техничкој реализацији бота (прикупљање података бих оставио другима). --филип ██ 13:41, 5. фебруар 2010. (CET) Морам Мирославу да одговорим:

То што су неки спавали док су ми вриједни људи помагали и давали идеје, ја нисам крив. Како сте тада жмирили на оба ока, сад ваљда можете на једно. [...] То што сте ви преспавали до почетка, ја вам опет нисам крив.

Превод: ако неко не уочи грешку пре почетка уноса, мора да ћути кад је уочи. Па, то тако не ради. Јесте постојала страница за припрему, и ја је јесам посетио, и видео да биолози (који су стручни за тему) раде заједно са тобом, и што бих се ја ту мешао? Нисам могао ни да замислим да ћеш програм радити на начин који си радио и да ће се грешке ове врсте појављивати.

Ако немате намјеру помоћи, онда немојте ни другима сметати.

Сматрам да је указивање на грешке помоћ а не сметња.

Није истина да 80% чланака има грешке. Недостатак податка није грешка, већ једноставно -одсуство податка-.

Недостатак податка који треба да постоји је ипак грешка (не на Википедији, али јесте грешка у твом програму). Ајд да зажмуримо на једно око па да кажемо да та грешка није много битна, али много гори проблем је што ти не знаш како је до те грешке дошло, а што значи да не можеш ни да знаш до каквих ће све грешака доћи у будућности.

Да сте пробали да их вадите, видјели бисте колико проблема има.

Ја јесам пробао да их вадим, и јесам видео колико проблема има. Сви ти проблеми су решиви, на један или други начин, али пошто нисам имао времена и воље да их решавам а ионако сам чекао преводе нисам ни кренуо са масовним уносом пуним грешака.

Грешка јест ако пише распрострањена до 100 м, а оно је до нпр. 1000 м. Тко ми је крив кад покушавам да убацим више података. Тај систем углавном ради, али повремено гријеши. Може се лако избацити.

То се лако може избацити, али китови који живе у мочварама, азијски гепард који живи у Африци, и слични су већ много већи проблем.

Није истина да је могуће урадити овај унос тако да нема ботовских грешака.

Могуће је урадити га тако да их има далеко мање него сад.

Ово није било могуће ни при уносу чисто нумеричких података (пројект НГЦ унос, пројект астероид унос)

Чекај, зар желиш да кажеш да и у тим пројектима постоје исте овакве грешке? Молим те реци ми да ниси тако мислио.

а камоли при вађењу стрингова из текста. Ви који сте програмери, знате колико је тешко радити са стринговима.

Управо зато се то и не ради на начин на који ти радиш.

Није истина да је при почетку уноса било грешака. Није било ниједне за коју смо тада знали.

Ево колико ја видим на првом унетом чланку си ручно исправио грешку[2] што значи да је ње било и да си за њу знао. На шестом унетом чланку Aaptosyax grypus стоји (већ скоро месец дана) да живи само у Тајланду а уствари живи у Лаосу и Тајланду. Дакле, грешака је било и при почетку уноса.

Како су онда настале грешке? Неке нисмо уочили на вријеме иако смо дуго гледали. Али већина је настала послије почетка уноса, управо мојим покушајима да изађем у сусрет сваком додатку који ми је неко предложио, да направим чланке бољима.

Не, грешке су настале захваљујући стихијском начину прикупљања и обраде података. Грешке су честе, махом случајне, и суштински неотклоњиве.

Истина је да нико од оних који сада највише критизирају, није помакао ни мали прст да ми да неки савјет (или изрази макар жељу за формат чланка) док је трајала припрема уноса. И то мјесецима. Ни Горан, ни Никола, ни Филип, ни Кастер. Нико. Ни малим прстом није макао.

Истина је такође да ти никакву помоћ ниси ни тражио. И да нико није имао појма да ти треба. Да не помињем да нико није имао твој е-маил, да не користиш ништа за четовање (а то је најпогоднији облик комуникације за овако нешто). И да сад кад ти се помоћ нуди, ти је одбијаш.

Истина је да је екстракција података из неформатираног и набацаног текста јако тешка, што зна свако ко је покушао да то некад ради. ИУЦН енглеске чланке су писали људи, имају много грешака, двосмислености, и десетине начина за изражавање једног податка. Примјери:

1. lives up to 300 m asl... 2. it can be found from sea level to 400m a.s.l... 3. maximum height where the species was found is bellow 1,200m a.s.l.... 4. does not occur bellow 2,000 meters above sea level... 5. ranges between 300-1,200 m.... 6. breeds in forest bellow 2300 m... 7. height distribution is from 200 to 500m a.s.l.... 8. occurs from sea level to 2000 m... 9. sea level-1200 m... 10. итд, итд....

Истина је да је екстракција података из неформатираног и набацаног текста као што је овај потпуно немогућа. Истина је такође и да није сав текст који ИУЦН нуди неформатиран и набацан, и да постоје начини да се из њега извуку корисни и тачни подаци.

Немојте продавати приче и причице о томе да се сада сви ти додатни подаци -које је Горан тек сада пронашао- могу убацити у програм. Не могу.

Наравно да не могу. Програм се мора поново писати од нуле, и то на тај начин да га је могуће лако проширивати у случају потребе. Тада ће бити лако могуће спајати податке из више извора.

А да то и покушам, то би повукло нове грешке које би опет засметале некима.

Надам се да немамо уреднике којима грешке не сметају.

Како је утврђено - и горе доказано - да неки људи не обраћају пажњу при припреми уноса, овим путем је покушано да се више људи укључи у процес пријаве грешака. Оне би тако (како је горе доказано) једино могле бити пронађене и исправљене.

Шта да ти кажем - изузетно си успео  

Када отклоним све пријављене грешке, поставићу поново 10000 истих побољшаних чланака на интернет, на увид и на преглед свима. Ово ће се понављати све док год не буде било грешака, паднем мртав поред тастатуре, или будем изабран за премијера Канаде. Чему сам ближи, трипут погађај.

Овом другом.

Дакле, предлажем следећи начин за решење проблема. Ти ми преко нечега пошаљеш ИУЦН странице које си скинуо. Ја ћу сести и урадити програм за екстракцију података. Правићу овде извештаје о напретку ако треба. Те податке ћу објавити, људи ће преконтролисати да ли програм ради добро. Поновити ако не ради.

Потом кад смо сигурни да имамо добре податке, заједно кренемо да правимо програм који их претвара у текст. Ту такође свако може да сугерише како ће текст да изгледа и да указује на грешке.

Е онда се крене са масовним уносом, и то лагано, по класама. Људи прегледају унете чланке, а нови чланци газе старе ако ови немају људске уреднике.

Никола, GOTO команда у Пајтону не постоји. Занимљиво је да то ниси знао као искусан програмер :)

Као прво, не видим зашто би искусан програмер морао да зна Пајтон.

Као друго, десило се да га помало натуцам, и наравно да знам да не постоји, али сем тога схватам и зашто не постоји. Никола (разговор) 17:48, 5. фебруар 2010. (CET)

Пошто је Филип понудио своју помоћ као програмер, ево и ја нудим као биолог, мада је Горан имплицирао да стручан нисам... и тако даље и тако даље. Ајде људи да стварно прекинемо са овим, јер нико не спори никога овде, нити ичију стручност. Ни Никола ни Мирослав не помажу оваквим препиркама, али сам сигуран да би вас двојица заједно са Филипом одрадили добар посао, као што ћемо Горан и ја прикупити све податке уз помоћ стручњака.  Горане, зезам се, мало уносим шале и комике, те апелујем да се што пре организујемо, а и помоћ око података би ми значила па чија год да је, а верујем да би неко од људи упућених у масовни унос могао да помогне. Помогло би (да поновим још једном) да програмери кажу шта од биолога очекују.--Методичар зговор2а 21:21, 5. фебруар 2010. (CET)

Па знаш како... једно је шта желимо, а друго је шта је реално. Ја бих најрадије волео SQL базу података са свим подацима (нека су и на енглеском), али то није реално. Што се мене тиче, довољне су публикације/сајтови/базе/извори информација где се налазе употребљиви подаци. А онда ћемо на неки начин учинити да они буду читљиви за рачунар (то је прилично заморан посао, али не би требало да буде немогућ). Направити бота за тако припремљене податке онда није никакав проблем. --филип ██ 23:53, 5. фебруар 2010. (CET)

Дискусија је нарасла, покушајмо да из тога извучемо најбоље за Википедију. Ботови нису спорни, многи их користе и све што се може аутоматизовати пожељно је, и ту ваљда нема спора. Када се неки тако масован посао ради, лоше би било да сеје за собом грешке, јер велики број тих чланака ће остати са тим грешкама ако се касније људском руком не исправи. Ако је могуће боље припремити бота да не сеје грешке то је идеално решење. Не треба да буде поражених страна (нисмо политичари) него сви радимо у истом циљу. Дакле, Ћика не постављај се у улогу кривца, него дозволи људима да помогну својим радом и сугестијама да бот буде бољи. Ако имаш осам сати да посечеш дрво, најбоље је шест сати оштрити секиру. Абрахам Линколн (1809-1865). --Ђорђе Стакић (р) 08:20, 7. фебруар 2010. (CET)

Дискусија је нарасла јер имамо кочничаре који на сваки начин не желе ботовски унос. Што се грешака тиче оне су пронађене и могу да се отклоне и то сада није проблем. Требало би да се крене са новим пробним мањим уносом са се увиди да ли има још грешака. Међутим Ћика је блокиран, а од њега се тражи да се из више извора продубљава ботовски унос. Бот има своја оганичења. --Alexmilt (разговор) 11:44, 7. фебруар 2010. (CET)

IspravakУреди

Ako se ne budu prepisivali clanci koji imaju nebotove u istoriji izmena, onda nećeš sve greške eliminisati. Jedino ako ideš preko svih članaka iz kategorije životinje koje je napravio bot. Možeš li onda da napravis listu svih članaka iz kategorije Životinje koji je napravio Miroslavov bot i nekako sortiraš po broju ne-botovskih izmena, da ne propadne sav ljudski trud? -- Bojan  Razgovor  18:49, 5. фебруар 2010. (CET)

Коментар SmirnofLeary (разговор)Уреди

Мислим да сам помогао доста око уноса, бар што се тиче слика. Преконтролисао сам сигурно 1000 чланака, око 100-150 дневно. А, у пројекат сам се укључио, јер сам раније заједно са Зрном написао чланак о групи врста из рода Коза: Козорог, док је Мирославов бот унео чланке за врсте, које иначе ми не бисмо уносили. По том питању се бот испоставио као више него добар, само што је то случај везан за породицу на којој је већ неко раније радио и знали смо како и где да повежемо и систематизујемо податке о унесеним чланцима. И ја бих предложио Мирославу модус по којем би се тимски радило месец или два на једној теми, рецимо на једном роду и пар породица животиња. Пошто је факат да уносимо велики број клица, требало би се потрудити да чланци за ред ако је могуће буду квалитетно и ручно написани на нивоу доброг чланка, а за породице и родове на нивоу горе наведених. Такав рад је смислен, они који помажу знају на чему раде, о чему да се информишу и коју тему да изучавају. За унос би се правила листа шта да се уноси, поред тога правиле би се помоћне листе, који чланци су преконтролисани, који имају слику, који имају преведене латинске називе итд. У том случају мислим да није битно што бот прави грешке, радило би се на чланцима и грешке би биле сигурно исправљане. Проблем је што ћемо на тај начин до краја године имати 10-15 добрих чланака о пар родова (супер ствар), око 50 чланака о породицама и редовима и унетих можда 1/5 чланака од замишњеног броја. SmirnofLeary (разговор) 13:15, 5. фебруар 2010. (CET)

Видим да се мој предлог доста поклапа са Славеновим. Оформимо тим, задамо циљеве. Можемо да радимо и преводе, не морају да буду ауторски чланци. Погледајмо на другим википедијама који чланци су изабрани за сјајне, направимо листу тих чланака, па преводимо њих. SmirnofLeary (разговор) 13:21, 5. фебруар 2010. (CET)
Сад замишљам одговор многих пуританаца: Ааааа па то је чисто превођење, то не може.... --Alexmilt (разговор) 13:32, 5. фебруар 2010. (CET)
То што ви предлажете нема баш везе са масовним уносом per se. Свако је слободан да даље допуњује све чланке који су настали масовним уносом (и то се неретко дешава и дан данас са глумцима, РСР или селима), али то не решава ефикасно питање тренутно унесених чланака и даљих уноса. --филип ██ 13:41, 5. фебруар 2010. (CET)
Мислим да се решава много тога, јер корисници у том случају знају о чему се ради. Код наведених козорога, знамо да од врста још није унет само сибирски, затим да нису унете подврсте и да неће ни бити уношене. Знамо где им је место у роду Коза, што је ажурирано у чланку и није направљена грешка да рецимо дивокозу стрпамо у козе и сл. Сви латински називи су преведени, пронађено је пар слика које су залутале на остави итд... У том делу нема ниједне грешке о којим причате, што ће рећи да су проблеми решени. Као и да се таквим приступом проблеми решавају. Са друге стране, да сте тако поступили код писања филмова сада бисмо имали квалитетне чланке рецимо о жанровима: Triler (filmski žanr), Хорор филм, Вестерн, Filmska komedija, први је клица, а на последњим стоји налепница за сређивање ... Велика је предност тимског и методичног рада у односу на насумично уношење по азбучном реду. Да је такав приступ бољи, елементи у периодном систему би били сортирани по азбучном реду, а не по правилима и законитостима. SmirnofLeary (разговор) 14:07, 5. фебруар 2010. (CET)