Linked data

Метод објављивања структурираних података

U računarstvu, linked data (često kapitalizuju kao Linked Data) opisuje metod objavljivanja strukturiranih podataka, tako da se može međusobno povezati i tako postaju korisniji za korisnike. On polazi od standardnih Web tehnologija kao što su HTTP, RDF i URI, ali umesto da ih koriste da služe samo za Web stranice koje služe čitaocima, ona ih proširuje da se dele informacije na način koji može da se automatski čitaju u računarima. Ovo omogućava da podaci iz različitih izvora budu ti koji su povezani. Linked Data je o korišćenju Web-a za povezivanje relevantnih podataka nije dodato da je anonimno povezan, ili koristeći Web da smanji prepreke za povezivanje podataka trenutno povezane koristeći druge metode. Preciznije, Vikipedija definiše Linked data kao "termin koji se koristi da opiše i preporuči najbolju praksu za izlaganje, deljenje, a povezuje delove podataka, informacija i znanja o semantičkog veba pomoću URI i RDF. Budući da većina organizacija živi na njihovoj unutrašnjoj znanja koja su inteligentno kombinuju sa veoma specifična (i najčešće javno dostupan) znanja (i podataka), oni bi imali koristi od LOD samo ako su pokriveni određenim domenima. Često citirao 'najbolja praksa' za LOD je to deo skupa podataka koji je dostupan na Bio2RDF. Prvi korak bi mogao biti da se napravi jasna razliku između deonica LOD oblaka koji je otvoren i koji nije. Skupovi bez dozvole treba eksplicitno označiti, jer su to oni koji su najproblematičniji za komercijalnu upotrebu, ne one koje nisu otvorene. Drugi napredak mogao biti sačinjen tako da su neki kriterijumi kvaliteta jasno propsani. Drugi napredak mogao biti napravljen tako što su neki kriterijumi kvaliteta jasno vidljiva. Najvažnije je da se oko održavanja i autorstvu: Ko preuzima odgovornost za kvalitet i pouzdanost podataka i ko je tačno održavalac.

Tim Berners-Li, direktor World Wide Web Consortium, napravio je termin u dizajnu uz napomenu da se raspravljaju pitanja oko projekta semantičkog veba.

Principi

uredi

Tim Berners-Li je navedeno četiri principa povezanih podataka u svojim Design Issues: Linked Data[1] napomena parafrazirao ovim redom:

  1. Koristite URI za označavanje stvari.
  2. Koristite HTTP URIs tako da se ove stvari mogu biti upućeni od strane ljudi i korisničkih agenata.
  3. Pruža korisne informacije o stvar kada je njegova URI se dereferenced, usklađivanje standarda kao što su RDF, SPARQL.
  4. Uključi linkove na druge srodne stvari (koristeći svoje URI) nakon objavljivanja podataka na Internetu.

Tim Berners-Lee je održao prezentaciju o povezanim podacima na konferenciji TED 2009[2]. Na konferenciji on je ponovio principe povezanih podataka kao tri "krajnje jednostavna" pravila:

  1. Sve vrste konceptualnih stvari, oni imaju imena koja počinju slovom sada HTTP.
  2. Ja sve važne informacije vraćam nazad. Ja ću se vratiti na neke podatke u standardnom formatu koji čini na neki način korisne podatke koje neko možda želeli da zna o toj stvari, o tom događaju.
  3. Ja ću da se vratim na tu informaciju koja nije dobila samo nečiju visinu i težinu i kada su rođeni, to je dobio odnosa. A kada ima veze, kad god ona izražava odnos onda je druga stvar da se to odnosi na jedno od tih imena koja počinje sa HTTP.

Komponente

uredi

Linking open-data community project

uredi

Primer veze unutar povezivanja otvorenih podataka u skupove podataka. Primer veze unutar povezivanja otvorenih podataka u skupove podataka Cilj W3C semantičkog Web prosvete i projekat povezivanja Javni podaci grupe je da proširi Web sa podacima dobara, objavljivanjem raznih otvorenih skupova i podataka kao i RDF na Internetu i postavljanjem RDF veze između stavki podataka iz različitih izvora podataka širom sveta. U oktobru 2007 godine, skup podataka se sastojao od preko dve milijarde RDF trojki, koji su povezanoj preko dva miliona RDF linkova. Do septembra 2011 godine ovo je poraslo na 31 milijardi RDF trojki, povezanoj oko 504 miliona RDF linkova.[3] Tu je interaktivna vizuelizacija povezanoj podataka postavlja za pregledanje kroz zamračenje.[4]

Projekti Evropske unije

uredi

Postoji veliki broj projekata Evropske unije koji uključuju povezane podatke. Ovo uključuje povezane otvorene podatke oko sat (LATC) projekta[5]. Projektne PlantetData[6], i Linked Open Data 2 (LOD2) projekat.[7] Podatak za povezivanje je jedan od osnovnih ciljevia EU Open Data Portal-a, koji čini dostupnim hiljade setova podataka za svako ponovno korišćenje i linkova.

Skupovi podataka

uredi
  • CKAN - registar otvorenih podataka i sadržaja paketa koje pruža Open Knowledge Foundation.
  • DBpedia - skup podataka koji sadrži podatke koji se izdvajaju iz Vikipedije; sadrži oko 3,4 miliona koncepta i koji se mogu opisati sa oko 1 milijardom trojki, uključujući i sažetaka na 11 različitih jezika.
  • GeoNames - pruža RDF opise sa više od 7,500,000 geografskih karakteristika koje se nalaze širom sveta.
  • UMBEL - lagana referentna struktura koju čini 20.000 predmeta koncepta nastave i njihovih veza izvedenim iz OpenCyc, koji su radili tako da im je cilj bio da obavezuju nastavu na spoljnom podataka; takođe ima veza sa 1,5 miliona imenovanih lica iz DBpedia i YAGO.
  • FOAF - skup podataka koji služi za opivanje lica, njihovih svojstava i odnosa.
  • Reegle - podaci povezani u jedan otvoreni bazen koji sadrži samo čistu energiju skupova svih podataka, izveštaje politike, projekat izlazne dokumente i terminologiju iz reegle.
  • Eagle-i - skup podataka koji služi za objavljivanje preko 60.000 kustos biomedicinskih izvora sa SPARQL krajnjih tačaka.
  • Ontobee - SPARQL - zasnovan je na povezivanju ontologija servera podataka i pregledača koji je iskorišćen za preko 100 ontologija koje sadrže više od dva miliona ontologije uslove.
  • LOG.DISIT - Linked Open Graph, LOG, predstavlja alat za višestruko SPARQL sedištem povezan je sa ontologijom pretraživanja i skupom ontologija za: Smart sity and mobility, smart could, ESCALP izvođačkim umetnostima, itd... na to se još može dodati veza sa Europeana, dbPedia, Geonames, Vocabulary of Getty, itd...

Vidi još

uredi

Reference

uredi
  1. ^ Linked Data—Design Issues
  2. ^ Tim Berners-Lee on the next Web
  3. ^ Linking Open Data
  4. ^ Interaktivna vizuelizacija povezanih skupova podataka
  5. ^ „Linked open data around the clock (LATC)”. Arhivirano iz originala 19. 09. 2018. g. Pristupljeno 26. 05. 2014. 
  6. ^ „PlanetData”. Arhivirano iz originala 21. 04. 2021. g. Pristupljeno 26. 05. 2014. 
  7. ^ „CORDIS FP7 ICT Projects – LOD2”. Arhivirano iz originala 07. 12. 2013. g. Pristupljeno 26. 05. 2014. 

Dodatna literatura

uredi

Spoljašnje veze

uredi