Prikazivanje podataka

стварање и проучавање визуелног представљања податак

Prikazivanje ili vizuelizacija podataka (često skraćeno kao data viz[1]) je interdisciplinarno polje koje se bavi grafičkim prikazom. To je naročito efikasan način komunikacije kada su podaci brojni, na primer u slučaju vremenskih serija. Sa akademske tačke gledišta, ovaj prikaz se može smatrati mapiranjem između izvornih podataka (obično numeričkih) i grafičkih elemenata (na primer, linije ili tačke na grafikonu). Mapiranje određuje kako atributi ovih elemenata variraju u odnosu na podatke. U ovom svetlu, stubičasti grafikon je mapiranje dužine stuba u odnosu na veličinu promenljive. Budući da grafički dizajn mapiranja može negativno da utiče na čitljivost grafikona[2], mapiranje je glavna kompetencija vizuelizacije podataka. Prikazivanje podataka ima svoje korene u polju statistike i stoga se generalno smatra granom deskriptivne statistike. Međutim, budući da su za efikasnu vizuelizaciju potrebne i veštine dizajniranja i statističke i računarske veštine, neki autori tvrde da je to i umetnost i nauka.[3]

Pregled uredi

 
Prikazivanje podataka je jedan od koraka u analiziranju podataka i njihovom predstavljanju korisnicima.

Za jasnu i efikasnu komunikaciju informacija, prikazivanje podataka koristi statističke grafike, grafikone, informacione grafike i druge alate. Numerički podaci mogu se kodirati uz pomoć tačaka, linija ili stubića da bi se vizuelno prenela kvantitativna poruka.[4] Efektivno prikazivanje pomaže korisnicima da analiziraju i rasuđuju o podacima i dokazima. To čini složene podatke pristupačnijim, razumljivijim i upotrebljivijim. Korisnici mogu imati određene analitičke zadatke, kao što je upoređivanje ili razumevanje uzročnosti, a princip dizajna grafike (tj. prikazivanje poređenja ili prikazivanje uzročnosti) prati zadatak. Tabele se obično koriste tamo gde će korisnici tražiti određeno merenje, dok se dijagrami različitih tipova koriste za prikaz obrazaca ili odnosa u podacima za jednu ili više promenljivih.

Prikazivanje podataka odnosi se na tehnike korišćene za komuniciranje podataka ili informacija kodiranjem u vizuelne objekte (npr. tačke, linije ili stubiće) sadržane u grafikonima. Cilj je da se informacije jasno i efikasno komuniciraju korisnicima. To je jedan od koraka u analizi podataka ili nauci o podacima. Prema Vitaliju Fridmanu (2008), „glavni cilj vizuelizacije podataka je da se informacije jasno i efikasno komuniciraju grafičkim sredstvima. Ne znači da prikazivanje podataka treba da izgleda dosadno da bi bila funkcionalna ili izuzetno sofisticirano da bi bila lepa. Da bi se ideje efektivno prenele, i estetska forma i funkcionalnost moraju ići ruku pod ruku, pružajući uvid u druge oskudne i složene skupove podataka, prenoseći njihove ključne aspekte na intuitivniji način. Ipak, dizajneri često ne uspevaju da postignu ravnotežu između forme i funkcije, stvarajući prelepe vizuelizacije podataka koje ne služe svojoj glavnoj svrsi - prenošenju informacija “.[5]

Zapravo, Fernanda Viegas i Martin M. Vatenberg sugerisali su da idealno prikazivanje ne bi smelo samo jasno da komunicira, već da podstiče angažovanje i pažnju gledalaca.[6]

Prikazivanje podataka je usko povezano sa informacionom grafikom, vizuelizacijom informacija, naučnom vizuelizacijom, analizom istraživačkih podataka i statističkim grafikonima. U novom milenijumu, prikazivanje podataka postalo je aktivno područje istraživanja, podučavanja i razvoja. Prema Postu i sar. (2002), ono objedinjuje naučnu vizuelizaciju i vizuelizaciju informacija.[7]

U komercijalnom okruženju, vizueaizacija podataka se često naziva kontrolnom tablom. Infografici su još jedan vrlo čest oblik vizuelizacije podataka.

Osnove uredi

Karakteristike efektivnih grafičkih prikaza uredi

 
Dijagram invazije Napoleonove Francuske na Rusiju autora Čarlsa Jozefa Minarda iz 1869. godine, rani primer informativne grafike

Profesor Edvard Tufte objasnio je da korisnici informativnih prikaza izvršavaju određene analitičke zadatke kao što je poređenje. Princip dizajna informativne grafike treba da podrži analitički zadatak.[8] Kao što su Vilijam Klivlend i Robert Makgil prikazali, različiti grafički elementi ovo mogu postići manje ili više efikasno. Na primer, tačkasti grafikoni i stubasti grafikoni nadmašuju pita dijagrame. [9]

U svojoj knjizi „Vizuelni prikaz kvantitativnih informacija“ iz 1983. godine, Edvard Tufte definiše „grafičke prikaze“ i principe za efikasno grafičko prikazivanje u sledećem pasusu: „Izvrsnost statističke grafike sastoji se od složenih ideja saopštenih sa jasnoćom, preciznošću i efikasnošću. Grafički prikazi treba da:

  • prikažu podatke
  • podstaknu gledaoca da razmišlja o suštini, a ne o metodologiji, grafičkom dizajnu, tehnologiji grafičke izrade ili nečemu drugom
  • izbegnu iskrivljavanje onoga što podaci treba da saopšte
  • predstave mnogo brojeva u malom prostoru
  • učine velike skupove podataka koherenim
  • ohrabre oko da uporedi različite delove podataka
  • otkriju podatke na nekoliko nivoa detalja, od širokog pregleda do fine strukture
  • imaju jasnu svrhu: opis, istraživanje, tabelarno prikazivanje ili ukrašavanje
  • budu usko integrisani sa statističkim i verbalnim opisima skupa podataka.

Grafikoni otkrivaju podatke. Zapravo, grafikon može da bude precizniji i da otkrije mnogo više od uobičajenih statističkih proračuna.[10]

Na primer, Minardov dijagram prikazuje gubitke koje je pretrpela Napoleonova vojska u periodu 1812.–1813. Ucrtano je šest promenljivih: veličina vojske, njen položaj na dvodimenzionalnoj površini (x i y), vreme, smer kretanja i temperatura. Širina linije ilustruje poređenje (veličina vojske u određenim vremenskim tačkama), dok osa temperature sugeriše uzrok promene veličine vojske. Ovaj multivarijantni prikaz na dvodimenzionalnoj površini govori priču koja se može odmah shvatiti dok istovremeno identifikuje izvorne podatke radi izgradnje kredibiliteta. Tufte je 1983. godine napisao: „Možda je to najbolji statistički grafikon ikada napravljena.“ [11]

Neprimenjivanje ovih principa može dovesti do pogrešnih grafikona koji iskrivljuju poruku ili podržavaju pogrešan zaključak. Prema Tufteu, grafički šum odnosi se na suvišnu unutrašnju dekoraciju grafikona koja ne poboljšava poruku, ili na neopravdane trodimenzionalne ili perspektivne efekte. Bespotrebno odvajanje eksplanatornog ključa od same slike, zahtevajući da se oko kreće napred-nazad od slike do ključa, oblik je „administrativnog otpada“. Odnos između podataka i mastila treba maksimizirati, brišući mastilo koje ne sadrži podatke gde je to moguće.[11]

Kongresna kancelarija za budžet je u prezentaciji iz juna 2014. godine rezimirala nekoliko najboljih praksi za grafičke prikaze. Tu su spadali:

a) Poznavanje publike;

b) Dizajn grafikona koji može biti samostalan van konteksta izveštaja; i

c) Dizajn grafikona koja saopštava ključne poruke u izveštaju. [12]

Kvantitativne poruke uredi

 
Vremenska serija ilustrovana linijskim grafikonom koji pokazuje trendove u federalnoj potrošnji i prihodima u Americi tokom vremena
 
Skater dijagram koji ilustruje negativnu korelaciju između dve promenljive (inflacija i nezaposlenost) merene u različitim tačkama tokom vremena

Autor Stiven Fju je opisao osam vrsta kvantitativnih poruka koje korisnici mogu da pokušaju da shvate ili iskomuniciraju iz skupa podataka i sa njim povezanih grafikona koji se koriste da pomognu da se poruka prenese:

  1. Vremenske serije: Jedna promenljiva se beleži tokom određenog vremenskog perioda, kao što je stopa nezaposlenosti tokom perioda od deset godina. Linijski grafikon se može koristiti za prikazivanje trenda.
  2. Rangiranje: Kategorijalne podele rangirane su u rastućem ili opadajućem redosledu, kao što je ocenjivanje prodajnog učinka (mera) od strane prodajnih lica (kategorija, gde je svako prodajno lice odeljak kategorije) tokom jednog perioda. Stubičasti grafikon može se koristiti za prikaz poređenja između prodajnih lica.
  3. Deo-celina: Kategorijalne podele se mere kao odnos prema celini (tj. procenat od 100%). Pita grafikon ili stubičasti grafikon mogu prikazati poređenje razmera, kao što je udeo koji predstavljaju konkurenti na tržištu.
  4. Odstupanje: Kategorijalne podele se upoređuju u odnosu na refrencu, kao što je poređenje stvarnih i budžetskih troškova za nekoliko odeljenja preduzeća u datom vremenskom periodu. Stubičasti grafikon može prikazati poređenje stvarnog i referentnog iznosa.
  5. Distribucija frekvencije: Prikazuje broj zapažanja određene promenljive za dati interval, kao što je broj godina u kojima je prinos na tržištu u intervalima kao što su 0-10% , 11-20%, itd. Histogram, vrsta stubičastog grafikona, može se koristiti za ovu analizu. Kutijasti dijagram pomaže u vizuelizaciji ključne statistike o distribuciji, kao što su medijana, kvartili, aberantni slučajevi, itd.
  6. Korelacija: Poređenje između opservacija predstavljenih dvema promenljivim (X,Y) da bi se utvrdilo da li imaju tendenciju da se kreću u istom ili suprotnom smeru. Na primer, ucrtavanje nezaposlenosti (X) i inflacije (Y) za uzorak od nekoliko meseci. Skater dijagram se obično koristi za ovu poruku.
  7. Nominalno poređenje: Poređenje kategorijalnih podela bez određenog redosleda, kao što je količina prodaje u odnosu na kod proizvoda. Za ovo poređenje može se koristiti stubičasti grafikon.
  8. Geografsko ili geoprostorno: Poređenje promenljive na mapi ili planu, kao što je stopa nezaposlenosti po državi ili broj osoba na različitim spratovima zgrade. Uobičajeno se koristi kartogram. [4][13]

Analitičari koji pregledaju skup podataka mogu razmotriti da li su neke ili sve poruke i gore navedeni tipovi grafikona primenljivi na njihov zadatak i publiku. Proces pokušaja i grešaka radi identifikovanja značajnih odnosa i poruka u podacima deo je eksplorativne analize podataka.

Vizuelna percepcija i prikazivanje podataka Čovek može lako da uvidi razlike u dužini linije, obliku, orijentaciji, rastojanju i boji (nijansi) bez značajnog napora u obradi; one se nazivaju „pre-atentivni atributi“. Na primer, možda će biti potrebno značajno vreme i napor („atentivna obrada“) da bi se identifikovao broj puta kada se cifra „5“ pojavljuje u nizu brojeva; ali ako se ta cifra razlikuje po veličini, orijentaciji ili boji, primeri cifre mogu se brzo uočiti pre-atentivnom obradom.[14]

Efektivni grafikoni koristi prednost pre-atentivne obrade i atributa i relativne snage ovih atributa. Na primer, s obzirom na to da ljudi mogu lakše da obrade razlike u dužini linije nego u površini, možda će biti efikasnije koristiti stubičasti grafikon (koji koristi prednost dužine linije za prikaz poređenja), a ne pita dijagrame (koje za prikaz poređenja koriste površinu).[14]

Ljudska percepcija/kognicija i prikazivanje podataka uredi

Gotovo sve vizuelizacije podataka stvorene su za ljudsku upotrebu. Znanje o ljudskoj percepciji i kogniciji je neophodno prilikom dizajniranja intuitivnih prikazivanje.[15]Kognicija se odnosi na procese u ljudima kao što su percepcija, pažnja, učenje, pamćenje, mišljenje, formiranje koncepata, čitanje i rešavanje problema.[16] Ljudska vizuelna obrada je efikasna u otkrivanju promena i upoređivanju količina, veličina, oblika i varijacija sa lakoćom. Kada se svojstva simboličnih podataka mapiraju u vizuelna svojstva, ljudi mogu efikasno da pretražuju velike količine podataka. Procenjuje se da 2/3 neurona u mozgu može biti uključeno u vizuelnu obradu. Pravilna prikazivanje pruža drugačiji pristup za prikazivanje potencijalnih veza, odnosa itd., koji možda nisu tako očigledni u nevizuelizovanim kvantitativnim podacima. Prikazivanje može postati sredstvo za eksploraciju podataka.

Studije su pokazale da pojedinci koriste u proseku 19% manje kognitivnih resursa i 4.5% su sposobniji da se prisete detalja prilikom poređenja vizualizovanih podataka sa tekstom.[17]

Istorija uredi

Ne postoji sveobuhvatna „istorija“ vizuelizacije podataka. Ne postoje izveštaji koji obuhvataju celokupan razvoj vizuelnog razmišljanja i vizuelnog predstavljanja podataka, i koji objedinjuju doprinose različitih disciplina.[18] Majkl Frendli i Daniel J. Denis sa Univerziteta Jork učestvovali su u projektu koji pokušava da pruži sveobuhvatnu istoriju vizuelizacije. Suprotno opštem verovanju, prikazivanje podataka nije moderan izum. Od praistorije, podaci o zvezdama ili informacije poput lokacije zvezda vizualizovali su se na zidovima pećina (poput onih pronađenih u pećini Lasku (fr. Lascaux) u južnom delu Francuske) još od perioda Pleistocena.[19] Fizički artefakti kao što su žetoni mezopotamske gline (5500. p. n. e.), Kipui iz perioda Inka (2600. p. n. e.) i grafikoni od štapova sa Maršalskih ostrva (n.d.) takođe se mogu smatrati vizuelizacijom kvantitativnih informacija.[20][21]

Prvo dokumentovano prikazivanje podataka može se videti još 1160. p. n. e. u vidu Torinske karte na papirusu koja tačno ilustruje distribuciju geoloških resursa i pruža informacije o vađenju tih resursa.[22] Takve mape mogu biti kategorizovane kao tematska kartografija, što je vrsta vizuelizacije podataka koja predstavlja i saopštava određene podatke i informacije putem geografske ilustracije dizajnirane da prikaže određenu temu povezanu sa određenim geografskim područjem. Najraniji dokumentovani oblici vizuelizacije podataka bile su razne tematske mape iz različitih kultura, i ideogrami i hijeroglifi koji su pružali i omogućavali tumačenje ilustrovanih informacija. Na primer, ploče sa Linearnim pismom B iz Mikene pružale su vizuelizaciju informacija u vezi sa trgovinama iz doba kasnog bronzanog doba na Mediteranu. Ideju koordinata koristili su drevni egipatski geodeti pri postavljanju gradova, položaji na zemlji i na nebu locirani su nečim sličnim geografskoj širini i dužini najmanje do 200. godine p. n. e., a projekcija mape sferične Zemlje u geografsku širinu i dužinu Klaudija Ptolomeja [c.85– c. 165] u Aleksandriji će služiti kao referentni standard do 14. veka.[22]

Izum papira i pergamenta omogućio je dalji razvoj prikazivanje kroz istoriju. Na slici je prikazan grafikon iz 10. ili možda 11. veka koji treba da predstavlja ilustraciju kretanja planeta, a koristi se u dodacima udžbenika u manastirskim školama.[23] Grafikon je očigledno trebalo da predstavlja dijagram inklinacija orbite planeta u funkciji vremena. U tu svrhu, zona zodijaka bila je predstavljena na ravni sa vodoravnom linijom podeljenom na trideset delova koje predstavljaju vreme ili uzdužnu osu. Vertikalna osa označava širinu zodijaka. Izgleda da je horizontalna skala izabrana za svaku planetu pojedinačno za periode koji se ne mogu poklopiti. Propratni tekst odnosi se samo na amplitude. Izgleda da krive nisu vremenski povezane.

 
Kretanje planeta

Do 16. veka, tehnike i instrumenti za precizno posmatranje i merenje fizičkih veličina, kao i geografskih i nebeskih položaj bili su dobro razvijeni (na primer, „zidni kvadrant“ koji je izgradio Tiho Brahe [1546–1601], pokrivajući čitav zid u svojoj opservatoriji). Najvažniji su bili razvoj triangulacije i drugih metoda za tačno određivanje lokacija na mapi.[18] Veoma rano, mera vremena navela je naučnike da razviju inovativan način vizuelizacije podataka (npr. Lorenc Kodoman 1596., Johanes Temporarius 1596 [24]).

Francuski filozof i matematičar Rene Dekart i Pjer de Ferma razvili su analitičku geometriju i dvodimenzionalni koordinatni sistem koji su u velikoj meri uticali na praktične metode prikazivanja i izračunavanja vrednosti. Rad Fermaa i Bleza Paskala na statistici i teoriji verovatnoće postavio je temelje za ono što danas konceptualizujemo kao podatke.[18] Prema Fondaciji Interaction Design, ovi događaji su omogućili i pomogli Vilijamu Plejferu, koji je video potencijal za saopštavanje kvantitativnih podataka putem grafike, da generiše i razvije grafičke metode statistike.[15]

 
Plejferova vremenska serija

U drugoj polovini 20. veka, Žak Berten upotrebio je kvantitativne grafikone da bi predstavio informacije „intuitivno, jasno, tačno i efikasno“.[15]

Džon Taki i Edvard Tufte pomerili su granice vizuelizacije podataka; Taki sa svojim novim statističkim pristupom eksplorativnoj analizi podataka i Tufte sa knjigom „Vizuelni prikaz kvantitativnih informacija“ otvorili su put ka usavršavanju tehnika vizuelizacije podataka ne samo za statističare. Sa napretkom tehnologije došlo je i do unapređenja vizuelizacije podataka; počevši od ručno nacrtanih prikazivanje, a zatim evoluirajući u sve više tehničke aplikacije - uključujući i interaktivne dizajne koji vode do vizuelizacije putem softvera.[24]

Programi poput SAS, SOFA, R, Minitab, Cornerstone i drugi omogućavaju vizuelizaciju podataka u polju statistike. Druge aplikacije za vizuelizaciju podataka, više specifične i jedinstvene za pojedince, kao i programski jezici kao što su D3, Python i JavaScript, omogućavaju vizuelizaciju kvantitativnih podataka. Privatne škole su takođe razvile programe kako bi zadovoljile potrebe za vizuelizacijom podataka o učenju i sa njima povezanim programskim bibliotekama, uključujući besplatne programe poput The Data Incubator ili plaćene programe poput General Assembly.[25]

Počevši od simpozijuma „Od podataka do otkrića“ 2013. godine (eng. "Data to Discovery", Fakultet likovnih umetnosti, Kalifornijski tehnološki univerzitet i Laboratorija za mlazni pogon u Pasadeni, Kalifornija, pokrenuli su godišnji program interaktivne vizuelizacije podataka.[26] Program postavlja pitanja: Kako interaktivna prikazivanje podataka može pomoći naučnicima i inženjerima da efikasnije istraže svoje podatke? Kako računarstvo, dizajn i razmišljanje o dizajnu mogu pomoći u maksimiziranju rezultata istraživanja? Koje su metodologije najefikasnije za iskorišćavanje znanja iz ovih oblasti? Kodiranjem relacionih informacija sa odgovarajućim vizuelnim i interaktivnim karakteristikama kako bi se pomoglo u ispitivanju i na kraju sticanju novog uvida u podatke, program razvija nove interdisciplinarne pristupe složenim naučnim problemima, kombinujući dizajnersko razmišljanje i najnovije metode iz računarstva, dizajna usmerenog na korisnika, intraktivnog dizajna i 3D grafike.

Terminologija uredi

Prikazivanje podataka uključuje specifičnu terminologiju, od kojih je neka izvedena iz statistike. Na primer, autor Stiven Fju definiše dve vrste podataka koji se koriste u kombinaciji kako bi podržali smislenu analizu i vizuelizaciju:

  • Kategorijalni: Predstavljaju grupe objekata sa određenim karakteristikama. Kategorijalne promenljive mogu biti nominalne ili ordinalne. Nominalne promenljive, na primer pol, nemaju poredak između redova, te su stoga nominalne. Ordinalne promenljive su kategorije sa redosledom, na primer za uzorak koji beleži starosnu grupu u koju neko spada.[27]
  • Kvantitativni: Predstavljaju mere, kao što su visina osobe ili temperatura okoline. Kvantitativne promenljive mogu biti kontinuirane ili diskretne. Kontinuirane promenljive predstavljaju ideju da se merenja uvek mogu izvršiti sa većom preciznošću. Dok diskretne promenljive imaju samo konačan broj mogućnosti, kao što je brojanje nekih ishoda ili starost izmerena tokom godina.[27]

Razlika između kvantitativnih i kategorijalnih promenljivih je važna jer ove dve vrste zahtevaju različite metode vizuelizacije. Dve osnove vrste prikazivanja informacija su tabele i grafikoni.

  • Tabela sadrži kvantitativne podatke organizovane u redove i kolone sa kategoričkim oznakama. Prvenstveno se koristi za pretragu određenih vrednosti. U gornjem primeru, tabela može imati kategorijalne oznake kolona koje predstavljaju ime (kvalitativna promenljiva) i starost (kvantitatinva promenljiva), pri čemu svaki red podataka predstavljaju jednu osobu (uzorkovana eksperimentaln jedinica ili kategorijalni odeljak).
  • Grafikon se prvenstveno koristi da prikaže vezu između podataka i prikazuje vrednosti kodirane kao vizuelni objekat (npr. linije, stubići ili tačke). Numeričke vrednosti se prikazuju unutar područja koje je označeno sa jednom ili više osa. Ove ose pružaju skale (kvantitativne i kategorijalne) koje se koriste za označavanje i dodeljivanje vrednosti vizuelnim objektima. Mnogi grafikoni se takođe nazivaju i dijagramima.[28]

Epler i Lengler su razvili „Periodni sistem metoda vizuelizacije“, interaktivnu tabelu koja prikazuje različite metode vizuelizacije podataka. Obuhvata šest vrsta metoda vizuelizacije podataka: podatke, informacije, koncept, strategiju, metaforu i celinu. [29]

Tehnike uredi

Naziv Vizuelne dimenzije Opis-primer upotrebe
Stubičasti grafikon ·       Dužina/količina

·       Kategorija

·       Boja

·       Predstavlja kategorijalne podatke sa pravougaonim stubićima sa visinama ili dužinama proporcionalnim vrednostima koje predstavlja. Stubići se mogu postaviti vertikalno ili horizontalno.

·       Stubičasti grafikoni prikazuju poređenje među diskretnim kategorijama. Jedna osa grafikona prikazuje specifične kategorije koje se upoređuju, a druga osa predstavlja izmerenu vrednost. Neki stubičasti grafikoni predstavljaju stubiće skupljene u više od jedne grupe, prikazujući vrednosti više od jedne izmerene promenljive. Ove skupljene grupe mogu se razlikovati uz pomoć boje.

·       Na primer; poređenje vrednosti, kao što je prodajni učinak za više osoba ili preduzeća u jednom vremenskom periodu.

Histogram ·       Ograničenje opsega grupe

·       Količina/dužina

·       Boja

·       Približna prezentacija distribucije numeričkih podataka. Podelite ceo raspon vrednosti u niz intervala i zatim prebrojte koliko vrednosti pada u svaki interval, ovo se naziva grupisanjem. Grupe su obično određene kao uzastopni, nepreklopljeni intervali promenljive. Grupe (intervali) moraju biti susedne i često su (ali nije neophodno da budu) jednake veličine.

·       Na primer, određivanje učestalosti godišnjih procentualnih povraćaja na berzi u određenim rasponima (grupe) kao što su 0-10%, 11-20% itd. Visina stubića predstavlja broj posmatranja (godina) sa povraćajem % u opsegu koji je predstavljen odgovarajućom grupom.

Skater dijagram ·       X pozicija

·       Y pozicija

·       Simbol/oznaka

·       Boja

·       Veličina


·       Koristi kartezijanske koordinate da prikaže vrednosti obično dve promenljive ili skupa podataka.

·       Tačke se mogu kodirati bojom, oblikom i/ili veličinom kako bi se prikazale dodatne promenljive.

·       Svaka tačka na dijagramu ima povezani x i y izraz koji određuje njeno mesto na kartezijanskoj ravni.

·       Skater dijagrami se obično koriste za prikazivanje korelacija između promenljivih (x i y).

Skater dijagram (3D) ·       Pozicija x

·       Pozicija y

·       Pozicija z

·       Boja

·       Simbol

·       Veličina

·       Slično kao u dvodimenzionalnom skater dijagramu iznad, i kod trodimenzionalnog skater dijagrama vizualizuje se veza između tipično 3 promenljive iz skupa podataka.

·       Ponovo se tačka može kodirati putem boje, oblika i/ili veličine da bi se prikazale dodatne promenljive.

Mreža ·       Veličina čvorova

·       Boja čvorova

·       Gustina veza

·       Boja veza

·       Spacijalizacija

·       Pronalaženje klastera u mreži (npr. grupisanje prijatelja na Fejsbuku u različite klastere).

·       Otkrivanje spona (informacioni posrednici) između klastera u mreži.

·       Utvrđivanje najuticajnijih čvorova u mreži (npr. kompanija želi da cilja malu grupu ljudi na Tviteru za marketing kampanju).

·       Pronalaženje autlajera koji se ne uklapaju u periferiju mreže.

Pita dijagram ·       Boja ·       Predstavlja jednu kategorijalnu promenljivu koja je podeljena na odseke da bi se ilustrovala numerička razmera. U pita dijagramu, dužina luka svakog odseka (a time i njegov centralni ugao i površina) proporcionalna je količini koju predstavlja.

·       Na primer, na dijagramu na levoj strani je prikazana proporcija ljudi širom sveta kojima je engleski maternji jezik.

Linijski dijagram ·       X pozicija

·       Y pozicija

·       Simbol/oznaka

·       Boja

·       Veličina

·       Predstavlja informacije kao niz tačaka podataka koje se nazivaju 'markeri' i koje su povezane segmentima prave linije.

·       Slično kao skater dijagram, osim što su tačke merenja poređane po redosledu (obično po njihovoj vrednosti na x osi) i povezane su segmentima pravih linija.

·       Često se koristi za vizuelizaciju trenda u podacima tokom vremenskih intervala – vremenska serija – stoga se linija često crta hronološki.

Streamgraph ·       Širina

·       Boja

·       Vreme (tok)

·       Tip složenog područnog grafikona koji se pomera oko centralne ose, rezultujući u obliku koji teče.

·       Za razliku od tradicionalnih složenih područnih grafikona, u kojima su slojevi naslagani na vrhu ose, slojevi dijagrama toka postavljeni su tako da umanjuju svoje ,,vijuganje.

·       Dijagrami toka prikazuju samo pozitivne vrednosti, i nemaju mogućnost prikazivanja i negativnih i pozitivnih vrednosti.

·       Na primer, na slici se vidi vizuelni prikaz muzike koju je slušalac poslušao tokom početka 2012. godine.

Treemap ·       Veličina

·       Boja

·       Predstavlja način prikazivanja hijerarhijskih podataka korišćenjem ugnežđenih figura, obično pravougaonika

·       Na primer, prostor na disku po lokaciji/tipu dokumenta

Gantov dijagram ·       Boja

·       Vreme (tok)

·       Vrsta stubičastog grafikona koja ilustruje raspored projekta

·       Moderni Gantovi dijagrami takođe pokazuju i odnos zavisnosti između aktivnosti i trenutnog statusa rasporeda

·       Na primer, koristi se u planiranju projekata

Toplotna karta ·       Boja

·       Kategorijalna promenljiva

·       Predstavlja opseg fenomena putem boja u dve dimenzije.

·       Postoje dve kategorije toplotnih karti:

o   klasterizovana toplotna karta: gde su opsezi postavljeni u ćelije fiksne veličine čiji su redovi i kolone kategorijalni podaci. Na primer, grafikon na levoj strani.

o   prostorna toplotna karta: gde nema matrice sa ćelijama fiksne veličine. Na primer, toplotna karta koja pokazuje gustinu stanovništva prikazanu na geografskoj karti.

Prikazivanje klime ·       X pozicija

·       Boja

·       Koristi niz obojenih pruga hronološki poređanih kako bi vizuelno prikazala dugoročne trendove u temperaturi.

·       Prikazuje jednu promenljivu - prototipski prekomernu temperaturu tokom vremena kako bi se prikazalo globalno zagrevanje.

·       Namerno minimalistička - bez tehničkih indicija - da bi na intuitivan način komunicirala sa laicima[30]

·       Može se „složiti“ da bi prikazala mnoštvo serija (primer)

Animirani spiralni grafikon ·       Udaljenost od prečnika (zavisna promenljiva)

·       Rotirajući ugao (okretanje kroz mesece)

·       Boja (godine koje prolaze)

·       Prikazuje jednu promenljivu - prototipski prekomernu temperaturu tokom vremena kako bi se prikazalo globalno zagrevanje

·       Zavisna promenljiva se progresivno postavlja duž neprekidne „spirale“ koja je utvrđena kao funkcija (a) ugla koji se neprestano okreće (dvanaest meseci po obrtaju) i (b) evoluirajuće boje (promene boja tokom godina koje prolaze) [31]

Kutijasti dijagram ·       x osa

·       y osa

·       Metoda za grafički prikaz grupa numeričkih podataka kroz njihove kvartile.

·       Kutije mogu takođe imati liniju koja se proteže od kutija (brkovi), što ukazuje na varijabilnost izvan gornjih i donjih kvartila.

·       Autlajeri mogu biti iscrtani kao pojedinačne tačke.

·       Dve kutije postavljene jedna na drugu predstavljaju središnjih 50% podataka, sa linijom koja razdvaja dve kutije i identifikuje srednju vrednost podataka, a gornja i donja ivica kutija predstavljaju tačke 75. i 25. percentila, respektivno.

·       Kutijasti dijagrami su neparametrijski: prikazuju varijacije u uzorcima statističke populacije bez donošenja bilo kakvih pretpostavki o osnovnoj statističkoj distribuciji, pa je korisno zaboraviti početno razumevanje skupa podataka. Na primer, upoređuje distribuciju godina između grupe ljudi (npr. muškaraca i žena).

Dijagram toka ·       Radni proces ili tok ·       Predstavlja radni proces, tok, ili korak-po-korak pristup rešavanju zadatka.

·       Dijagrami toka prikazuju korake kao kutije različitih vrsta, kao i njihov redosled povezivanjem kutija sa strelicama.

·       Na primer, ukazuje na radnje koje je potrebno izvršiti ukoliko lampa ne radi, kao što je prikazano na slici.

Radar dijagram ·       Atributi

·       Vrednost dodeljena atributima

·       Prikazuje multivarijantne podatke u obliku dvodimenzionalnog dijagrama od tri ili više kvantitativnih promenljivih koje su predstavljene na osama počevši od iste tačke.

·       Relativni položaj i ugao osa je obično neinformativan, ali različiti heuristički algoritmi, kao što su algoritmi koji ucrtavaju podatke kao maksimalno ukupno područje, mogu se primeniti za razvrstavanje promenljivih (osa) u relativne pozicije koje otkrivaju distinktivne korelacije, razmere, i mnoštvo drugih uporednih mera.

·       Na primer, upoređivanje atributa/veština (npr. komunikacijskih, analitičkih, IT veština) naučenih putem različitih univerzitetskih smerova (npr. matematika, ekonomija, psihologija)

Venov dijagram ·       Sve moguće logičke veze između konačnog zbira različitih skupova ·       Prikazuje sve moguće logičke odnose između konačnog zbira različitih skupova.

·       Ovi dijagrami pokazuju elemente kao tačke u ravni, a skupovi su oblasti u zatvorenim krivim linijama.

·       Venov dijagram se sastoji od većeg broja zatvorenih krivih linija, obično krugova, koje se preklapaju, od kojih svaka predstavlja skup.

·       Tačke unutar krive označene slovom S predstavljaju elemente skupa S, dok tačke izvan granica predstavljaju elemente koji nisu u skupu S. Ovo se prilagođava intuitivnim prikazivanjema; na primer, skup svih elemenata koji su članovi i skupa S i skupa T, označeni kao ST, a čitaju se kao „presek S i T “, vizuelno je predstavljen površinom preklapanja regija S i T. U Venovim dijagramima, krive se preklapaju na svaki mogući način, pokazujući sve moguće veze između skupova.

 
 
 
 
 
 
 
 
 
 
 
 

Interaktivnost uredi

Interaktivno prikazivanje podataka omogućava direktne akcije na grafikonu kako bi se promenili elementi i veza između različitih crteža.[32]

Interaktivnu vizuelizaciju podataka statističari su proučavali od kraja 1960-ih. Primeri razvoja mogu se naći u video biblioteci američkog statističkog udruženja.[33]

Uobičajene interakcije uključuju:

Četkanje: radi uz pomoć miša kako bi se kontrolisala četka za bojenje, direktno menjajući boju ili crteže elemenata na grafikonu. Četka za bojenje je ponekad pokazivač, a ponekad deluje crtajući svojevrsni okvir oko tačaka; okvir je ponekad nepravilnog oblika, poput lasa. Četkanje se najčešće koristi kada je vidljivo više grafikona i postoji neki mehanizam koji ih povezuje. Postoji nekoliko različitih konceptualnih modela četkanja i niz mehanizama zajedničkog povezivanja. Četkanje skater dijagrama može biti privremena operacija, u kojoj tačke na aktivnom grafikonu zadržavaju svoje nove karakteristike samo dok su zatvorene ili označene četkom, ili može biti trajna operacija, tako da tačke zadrže svoj novi izgled nakon što se četka odmakne. Prelazno četkanje obično se bira za četkanje radi povezivanja, kao što smo upravo opisali.

Slikanje: Dugotrajno četkanje je korisno kada želimo da grupišemo tačke u klastere, a zatim nastavimo da koristimo druge operacije, kao što je pregled, za upoređivanje grupa. Postalo je uobičajeno da se dugotrajna operacija naziva slikanjem.


Identifikacija: koja bi se takođe mogla nazvati označavanje ili četkanje oznaka, je još jedna manipulacija grafikonom koja se može povezati. Približavanjem kursora blizu tačke ili ivice u skater dijagramu ili stubića na stubičastom grafikonu, pojavljuje se oznaka koja identifikuje element grafikona. Veoma je rasprostranjena u mnogim interaktivnim grafikonima, a ponekad se naziva i prelezak mišem.


Skaliranje: preslikava podatke na prozor, a promene u području funkcije mapiranja pomažu nam da naučimo različite stvari iz istog grafika. Skaliranje se obično koristi kada želimo da zumiramo u gustu oblast skater dijagrama, a može se koristiti i za promenu aspekta odnosa grafikona, kako bi se otkrile različite karakteristike podataka.


Povezivanje: povezuje elemente odabrane u jednom grafikonu sa elementima drugog grafikona. Najjednostavnija vrsta povezivanja, jedan na jedan, gde oba grafika pokazuju različite projekcije istih podataka, a tačka na jednom grafiku tačno odgovara tački na drugom. Kada koristite grafikone područja, četkanje bilo kog dela površine ima isti efekat kao i četkanje celog, i ekvivalentno je odabiru svih slučajeva u odgovarajućoj kategoriji. Čak i kada neki elementi grafikona predstavljaju više od jednog slučaja, osnovno pravilo povezivanja i dalje povezuje jedan slučaj u jednom grafikonu sa istim slučajem u drugim grafikonima. Povezivanje se može vršiti i kategorijalnom promenljivom, na primer ID-om subjekta, tako da su sve vrednosti podataka koje odgovaraju tom subjektu istaknute u svim vidljivim grafikonima.

Druge perspektive uredi

Postoje različiti pristupi opsegu vizuelizacije podataka. Zajednički fokus je na prezentaciji informacija, kao što je rekao Fridman (2008). Frendli (2008) pretpostavlja dva glavna dela vizuelizacije podataka: statistička grafika i tematska kartografija.[34] U ovom svetlu, članak „Prikazivanje podataka: moderni pristupi“ (2007) daje pregled sedam predmeta vizuelizacije podataka:[35]

  • Članci i resursi
  • Prikazivanje veza
  • Prikazivanje podataka.
  • Prikazivanje vesti
  • Prikazivanje veb-sajtova
  • mape uma
  • Alati i usluge

Svi ovi predmeti su usko povezani sa grafičkim dizajnom i predstavljanjem informacija.

S druge strane, iz perspektive nauke o računaru, Frits H. Post je 2002. godine kategorizovao ovo polje u pod-polja: [7][36]

  • Prikazivanje informacija
  • Tehnike interakcije i arhitekture
  • Tehnike modeliranja
  • Metode sa više rešenja
  • Algoritmi i tehnike vizuelizacije
  • Prikazivanje obima

U okviru Harvard Business Review, Skot Berinato razvio je okvir za pristup vizuelizaciji podataka.[37] Da bi korisnici počeli da razmišljaju vizuelno, oni moraju da razmotre dva pitanja; 1) šta imate i 2) šta radite. Prvi korak je identifikovanje podataka koje želite da vizualizujete. To je vođeno podacima, kao profit u proteklih deset godina ili konceptuala ideja o tome kako je strukturisana određena organizacija. Jednom kada se odgovori na ovo pitanje, možete se fokusirati na to da li pokušavate da saopštite informacije (deklarativna prikazivanje) ili pokušavate nešto d shvatite (eksplorativna prikazivanje). Skot Berinato kombinuje ova pitanja dajući četiri vrste vizuelne komunikacije koja svaka ima svoje ciljeve. [36]

Ove četiri vrste vizuelne komunikacije su sledeće:

  • Ilustracija ideje (konceptualna i deklarativna). [36]

Koristi se za podučavanje, objašnjavanje i/ili jednostavne koncepte. Na primer, dijagrami organizacije i stabla odlučivanja.

  • Generisanje ideja (konceptualno i eksplorativno). [36]

Koristi se za otkrivanje, inovacije i rešavanje problema. Na primer, tabla posle sesije brainstorminga.

  • Vizuelno otkrivanje (vođeno podacima i eksplorativno).[36]

Koristi se za uočavanje trendova i dobijanje smisla u podacima. Ova vrsta vizuelnog oblika je češća kod velikih i složenih podataka gde je skup podataka donekle nepoznat, a zadatak je otvorenog tipa.

  • Svakodnevna prikazivanje podataka (vođena podacima i deklarativna). [36]

Najčešći i najjednostavniji tip vizuelizacije koji se koristi za utvrđivanje i postavljanje konteksta. Na primer, linijski grafikon BDP-a tokom vremena.

Arhitektura predstavljanja podataka uredi

Arhitektura predstavljanja podataka (DPA) je skup veština koji pokušava da identifikuje, locira, manipuliše, oblikuje i prezentuje podatke na takav način da optimalno saopštava značenje i odgovarajuće znanje.

Istorijski, izraz arhitektura predstavljanja podataka pripisuje se Keli Laut: „Arhitektura predstavljanja podataka (DPA) je retko primenjivan skup veština ključnih za uspeh i vrednost Poslovne inteligencije. Arhitektura prezentacije podataka udružuje nauku o brojevima, podacima i statistici otkrivajući dragocene informacije iz podataka i čineći ih upotrebljivim, relevantnim i primenljivim u pogledu vizuelizacije podataka, komunikacije, organizacione psihologije i upravljanja promenama kako bi se pružila rešenja za poslovnu inteligenciju sa obimom podataka, vremenom isporuke, formatom i prikazivanjema koje će najefikasnije podržati i usmeriti operativno, taktičko i strateško ponašanje prema razumljivim poslovnim (ili organizacionim) ciljevima. DPA nije ni skup IT, niti poslovnih veština, ali postoji kao posebno polje stručnosti. Često mešana sa vizuelizacijom podataka, arhitektura predstavljanja podataka je mnogo širi skup veština koji uključuje određivanje koje podatke, po kom rasporedu, u kom formatu treba predstaviti, a ne samo najbolji način predstavljanja podataka koji su već izabrani. Veštine vizuelizacije podataka su jedan od elemenata DPA.

Izvori uredi

  1. ^ Prva formalna, zabeležena, javna upotreba izraza arihitektura predstavljanja podataka bila je na tri formalna događaja pokretanja Microsoft Office 2007 u decembru, januaru i februaru 2007–08 u Edmontonu, Kalgariju i Vankuveru (Kanada) u prezentaciji Keli Laut koja je opisivala sistem poslovne inteligencije dizajniran da poboljša kvalitet usluge u kompaniji za proizvodnju celuloze i papira. Termin je dalje korišćen i zabeležen u javnoj upotrebi 16. decembra 2009. godine u Microsoft Canada prezentaciji o vrednosti spajanja poslovne inteligencije sa procesima korporativne saradnje.
  2. ^ Nussbaumer Knaflic, Cole (2 November 2015). Storytelling with Data: A Data Visualization Guide for Business Professionals. ISBN 978-1-119-00225-3
  3. ^ Gershon, Nahum; Page, Ward (2001). „What storytelling can do for information visualization”. Communications of the ACM. 44 (8): 31—37. S2CID 7666107. doi:10.1145/381641.381653. 
  4. ^ a b Jump up to:a b "Stephen Few-Perceptual Edge-Selecting the Right Graph for Your Message-2004"(PDF). Archived (PDF) from the original on 2014-10-05. Retrieved 2014-09-08.
  5. ^ Vitaly Friedman (2008) "Data Visualization and Infographics" Archived 2008-07-22 at the Wayback Machine in: Graphics, Monday Inspiration, January 14th, 2008
  6. ^ Fernanda Viegas and Martin Wattenberg (April 19, 2011). "How To Make Data Look Sexy". CNN.com. Archived from the original on May 6, 2011. Retrieved May 7, 2017
  7. ^ a b Jump up to:a b Frits H. Post, Gregory M. Nielson and Georges-Pierre Bonneau (2002). Data Visualization: The State of the Art. Research paper TU delft, 2002. Archived 2009-10-07 at the Wayback Machine.
  8. ^ techatstate (7 August 2013). "Tech@State: Data Visualization - Keynote by Dr Edward Tufte". Archived from the original on 29 March 2017. Retrieved 29 November 2016 – via YouTube.
  9. ^ Cleveland, William S.; McGill, Robert (1985). „Graphical Perception and Graphical Methods for Analyzing Scientific Data”. Science. 229 (4716): 828—833. PMID 17777913. S2CID 16342041. doi:10.1126/science.229.4716.828. 
  10. ^ Jump up to:a b c Tufte, Edward (1983). The Visual Display of Quantitative Information. Cheshire, Connecticut: Graphics Press. ISBN 0-9613921-4-2. Archived from the original on 2013-01-14. Retrieved 2019-08-10.
  11. ^ a b Jump up to:a b c Tufte, Edward (1983). The Visual Display of Quantitative Information. Cheshire, Connecticut: Graphics Press. ISBN 0-9613921-4-2. Archived from the original on 2013-01-14. Retrieved 2019-08-10.
  12. ^ "Telling Visual Stories About Data - Congressional Budget Office". www.cbo.gov. Archived from the original on 2014-12-04. Retrieved 2014-11-27
  13. ^ "Stephen Few-Perceptual Edge-Graph Selection Matrix" (PDF). Archived (PDF) from the original on 2014-10-05. Retrieved 2014-09-08.
  14. ^ a b Jump up to:a b "Steven Few-Tapping the Power of Visual Perception-September 2004" (PDF). Archived (PDF) from the original on 2014-10-05. Retrieved 2014-10-08.
  15. ^ a b v Jump up to:a b c "Data Visualization for Human Perception". The Interaction Design Foundation. Archived from the original on 2015-11-23. Retrieved 2015-11-23.
  16. ^ "Visualization" (PDF). SFU. SFU lecture. Archived from the original (PDF) on 2016-01-22. Retrieved 2015-11-22.
  17. ^ Graham, Fiona (2012-04-17). "Can images stop data overload?". BBC News. Retrieved 2020-07-30
  18. ^ a b v Jump up to:a b c Friendly, Michael. "A Brief History of Data Visualization". Springer-Verlag. CiteSeerX 10.1.1.446.458.
  19. ^ Whitehouse, D. (9 August 2000). "Ice Age star map discovered". BBC News. Archived from the original on 6 January 2018. Retrieved 20 January 2018.
  20. ^ Dragicevic, Pierre; Jansen, Yvonne (2012). "List of Physical Visualizations and Related Artefacts". Archived from the original on 2018-01-13. Retrieved 2018-01-12
  21. ^ Jansen, Yvonne; Dragicevic, Pierre; Isenberg, Petra; Alexander, Jason; Karnik, Abhijit; Kildal, Johan; Subramanian, Sriram; Hornbæk, Kasper (2015). "Opportunities and challenges for data physicalization". Proceedings of the 33rd Annual ACM Conference on Human Factors in Computing Systems: 3227–3236. Archived from the original on 2018-01-13. Retrieved 2018-01-12.
  22. ^ a b Jump up to:a b Friendly, Michael (2001). "Milestones in the history of thematic cartography, statistical graphics, and data visualization". Archived from the original on 2014-04-14.
  23. ^ Funkhouser, H. Gray (1936). „A Note on a Tenth Century Graph”. Osiris. 1: 260—262. JSTOR 301609. S2CID 144492131. doi:10.1086/368425. 
  24. ^ Friendly, Michael (2006). "A Brief History of Data Visualization" (PDF). York University. Springer-Verlag. Archived (PDF) from the original on 2016-05-08. Retrieved 2015-11-22.
  25. ^ "NY gets new boot camp for data scientists: It's free but harder to get into than Harvard". Venture Beat. Archived from the original on 2016-02-15. Retrieved 2016-02-21.
  26. ^ Interactive Data Visualization
  27. ^ a b Jump up to:a b Bulmer, Michael (2013). A Portable Introduction to Data Analysis. The University of Queensland: Publish on Demand Centre. . str. 4—5. ISBN 978-1-921723-10-0.  Nedostaje ili je prazan parametar |title= (pomoć).
  28. ^ "Steven Few-Selecting the Right Graph for Your Message-September 2004" (PDF). Archived (PDF) from the original on 2014-10-05. Retrieved 2014-09-08.
  29. ^ Lengler, Ralph; Eppler, Martin. J. "Periodic Table of Visualization Methods". www.visual-literacy.org. Archived from the original on 16 March 2013. Retrieved 15 March 2013.
  30. ^ Kahn, Brian (June 17, 2019). "This Striking Climate Change Visualization Is Now Customizable for Any Place on Earth". Gizmodo. Archived from the original on June 26, 2019. Developed in May 2018 by Ed Hawkins, University of Reading.
  31. ^ Mooney, Chris (11 May 2016). "This scientist just changed how we think about climate change with one GIF". The Washington Post. Archived from the original on 6 February 2019. Ed Hawkins took these monthly temperature data and plotted them in the form of a spiral, so that for each year, there are twelve points, one for each month, around the center of a circle – with warmer temperatures farther outward and colder temperatures nearer inward.
  32. ^ Swayne, Deborah (1999). "Introduction to the special issue on interactive graphical data analysis: What is interaction?". Computational Statistics. . 14 (1): 1—6.  Nedostaje ili je prazan parametar |title= (pomoć)
  33. ^ American Statistics Association, Statistical Graphics Section. "Video Lending Library".
  34. ^ Michael Friendly (2008). "Milestones in the history of thematic cartography, statistical graphics, and data visualization" Archived 2008-09-11 at the Wayback Machine.
  35. ^ "Data Visualization: Modern Approaches" Archived 2008-07-22 at the Wayback Machine. in: Graphics, August 2nd, 2007
  36. ^ a b v g d đ Frits H. Post, Gregory M. Nielson and Georges-Pierre Bonneau (2002). Data Visualization: The State of the Art Archived 2009-10-07 at the Wayback Machine
  37. ^ ^ Jump up to:a b c d e f Berinato, Scott (June 2016). "Visualizations That Really Work". Harvard Business Review: 92–100