Нацрт:Složeno pretraživanje podataka

Složeno pretraživanje podataka opisuje istraživačko polje koje se bavi primenom pretraživanja podataka, mašinskog učenja i statistike, pa sve do informacija koje su dobijene iz obrazovnih okvira (kao što su univerziteti i pametni tutorski sistemi). Na visokom nivou, ova oblast traži rešenja za razvoj i poboljšanje metoda za istraživanje ovih podataka, koji često imaju više nivoa smisaone hijerarhije, u cilju otkrivanja novih uvida o načinima na koje ljudi uče kroz kontekst ovakvih postavki. [1] Čineći to, složeno pretraživanje podataka je doprinelo teorijama učenja koje su istraživali istraživači u obrazovnoj psihologiji i naukama o učenju. [2] Ova oblast je usko povezana sa analitikom učenja, i ove dve oblasti se međusobno porede i suprotstavljaju. [3]

Definicija uredi

Pretraživanje podataka se odnosi na tehnike, alate i istraživanja, i modelovano je za automatsko ekstrahovanje značenja iz velikih baza podataka koje su proizašle iz, ili su povezane sa aktivnostima učenja ljudi u obrazovnim okruženjima. Ovi podaci su vrlo često opsežni, detaljno izanalizirani i precizni. Na primer, nekoliko sistema za upravljanje učenjem (LMS) prate informacije, npr. mogu da prate rad svakog učenika i njihov pristup predmetu učenja, koliko puta je učenik pristupio predmetu i koliko se minuta korisnik zadržao na određenom predmetu. Zatim, kroz primer inteligentnih tutorskih sistema, možemo videti kako se podaci beleže svaki put kada učenik predloži rešenje problema. Oni mogu prikupiti vreme za predaju rada, bez obzira na to da li se rešenje podudara sa očekivanim rešenjem, količinu vremena koja je prošla od poslednjeg unosa, redosled kojim su rešenja unesene u programski interfejs i sl. Preciznost ovih podataka je takva da čak i prilično kratka sesija u računarskom okruženju za učenje ( npr. 30 minuta) može proizvesti veliku količinu podataka koji zahtevaju dalju analizu.

U drugim slučajevima podaci nisu toliko detaljno izanalizirani. Na primer, prepis sa fakulteta može da sadrži vremenski uređenu listu predmeta koje je student pohađao, ocenu koju je student dobio na svakom predmetu i kada je student izabrao ili promenio akademsku spremu . EDM koristi obe vrste podataka da bi otkrio korisne informacije o različitim tipovima učenika i o načinu njihovog učenja, strukturi područja znanja i efektu strategija podučavanja, koje su ugrađene u različita okruženja za učenje. Ove analize nas opskrbljuju novim informacijama, koje bi bilo teško raspoznati ukoliko bismo posmatrali samo sirove, neobrađene podatke. Na primer, analiziranje podataka iz LMS-a može nam pomoći u otkrivanju veze između predmeta učenja, kojima su studenti imao pristup tokom pohađanja nastave i njihove konačne ocene. Slično tome, analiza prepisa podataka učenika, može otkriti vezu između ocena studenata iz određenog predmeta i njihove odluke da promene svoj smer obrazovanja. Takve informacije nam pružaju uvid u model obrazovnog okruženja, što omogućava učenicima, nastavnicima, školskim administratorima i tvorcima obrazovne politike da donose utemeljene odluke o tome kako da uzajamno deluju, da obezbede i da upravljaju obrazovnim sadržajem.

Istorija uredi

Iako analiza obrazovnih podataka sama po sebi nije nova veština, nedavni napredak u obrazovnoj tehnologiji, uključujući sve veći značaj snage procene i sposobnosti uočavanja fino izanaliziranih podataka o upotrebi računarskog obrazovnog okruženja. Sve ove komponente su doprinele povećanosti interesovanja za razvoj tehnika za analizu velike količine podataka prikupljenih u obrazovnim okruženjima. Ovo interesovanje pretočeno je u niz EDM radionica održanih od 2000. do 2007. godine, u okviru nekoliko međunarodnih istraživačkih konferencija . [4] Grupa istraživača osnovala je 2008. godišnju međunarodnu konferenciju na temu EDM-a, od kojih se prva održala u Montrealu, Kvebek, Kanada. [5]

Kako je interesovanje za EDM nastavilo da raste, istraživači EDM-a su 2009. godine osnovali akademski časopis pod nazivom Journal of Educational Data Mining(Časopis o pretraživanju podataka u oblasti obrazovanja). Ovaj časopis je trebalo da omogući lakšu razmenu i širenje rezultata istraživanja. 2011. istraživači EDM-a osnovali su Međunarodno društvo za pretraživanje podataka u oblasti obrazovanja, kako bi lakše povezali istraživače EDM-a i nastavili da napreduju u ovoj oblasti.

Uvođenjem javno dostupnih baza podataka o obrazovanju 2008. godine, poput: Pittsburgh Science of Learning Centre Data shop, (otvoren repozitorijum podataka i skup povezanih alata za vizuelizaciju i analizu) i Republičkog zavoda za statistiku, javni skupovi podataka učinili su prikupljanje obrazovnih podataka mnogo pristupačnijim i izvodljivijim, a samim tim su doprineli i njihovom rastu. [6]

Ciljevi uredi

Rajan S. Bejker i Kalina Jasef [7] utvrdili su sledeća četiri cilja EDM-a:

  1. Predviđanje budućih učeničkih navika - Korišćenjem studentskog modeliranja, ovaj cilj može biti postignut stvaranjem studentskih modela koji se odnose na osobine učenika, uključujući razmatranje detaljnih informacija, kao što su znanje učenika, ponašanje i motivacija pri učenju. Takođe se meri njihovo korisničko iskustvo, kao i ukupno zadovoljstvo samim procesom učenja.
  2. Otkrivanje ili poboljšanje modela domena - Kroz različite metode i primene EDM-a moguće je otkrivanje novih i poboljšanja postojećih modela. Primeri uključuju ilustraciju obrazovnog sadržaja, za uključivanje učenika i određivanje optimalnih nastavnih redosleda, kako bi podržali stil učenja učenika.
  3. Izučavanje efekata obrazovne podrške koji se mogu postići kroz sistema učenja.
  4. Unapređenje naučnog znanja o učenju i učenicima kroz izgradnju i implementaciju studentskih modela, polje istraživanja EDM-a i tehnologije i softvera koji se upotrebljavaju.

Korisnici i zainteresovane strane uredi

Postoje četiri glavna korisnika i zainteresovane strane uključene u rukovođenje pretraživanja podataka u polju obrazovanja. Oni uključuju sledeće kategorije:

  • Učenici - Učenici su zainteresovani za razumevanje potreba studenata i metoda za poboljšanje iskustva i učinkovitosti učenika. [8] Na primer, učenici mogu profitirati i od otkrivenog znanja, koristeći EDM alate kako bi predložili aktivnosti i izvore, koje mogu koristiti u zavisnosti od njihovog odnosa prema elektronskom učenju i uvida u prošle aktivnosti ili u primere sličnih učenika. [9] A što se tiče mlađih učenika, pretraživanje obrazovnih podataka, može takođe informisati roditelje o napretku njihovog deteta u procesu učenja. [10] Takođe je neophodno efikasno grupisati učenike u elektronskom okruženju. Izazov je korišćenje složenih podataka za učenje i tumačenje ovih grupa kroz razvijanje primenjivih modela. [11]
  • Učitelji - Učitelji pokušavaju da razumeju proces učenja i metode koje mogu primeniti u cilju poboljšanja svojih nastavnih metoda. Nastavnici mogu da primene EDM, da bi utvrdili najbolji način organizacije i da bi sastavili nastavni plan i program, pronašli najbolje metode za dostavljanje informacija o kursevima i alate koje će koristiti za angažovanje svojih učenika za dostizanje optimalnih rezultata učenja. [12] Naročito destilacija podataka, koja se koristi za ljudsku tehniku vrednovanja, i ona pruža priliku nastavnicima da profitiraju od samog korišćenja EDM-a, jer im omogućava da brzo prepoznaju obrasce ponašanja, što može podržati njihove nastavne metode tokom trajanja časova, ili im pak može pomoći da poboljšaju buduće časove. Natavnici mogu odrediti pokazatelje koji utiču na zadovoljstvo učenika i njihovu angažovanost na predmetu, a mogu pratiti i njihov napredak u učenju.
  • Istraživači - Istraživači se fokusiraju na razvoj i procenu efikasnosti tehnika pretraživanja podataka. Godišnja međunarodna konferencija za istraživače započela je 2008. godine, prethodeći osnivanju Journal of Educational Data Mining, 2009. godine. Širok spektar tema u EDM-u tiču se korišćenja pretrage podataka, kako bi se poboljšala efikasnost obrazovnih institucija u napredovanju učenika.
  • Administratori - Administratori su odgovorni za raspodelu resursa za primenu u institucijama. Kako se institucije sve više smatraju odgovornim za uspeh učenika, administriranje EDM aplikacija postaje sve češće u obrazovnim okruženjima. Fakulteti i savetnici su više uključeni u proces identifikovanja i obraćanja studentima kojima je potrebna neka vrsta pomoći pri učenju. Međutim, ponekad je izazov preneti informacije donosiocima odluka, kako bi oni mogli blagovremeno i efikasno da sprovedu donošenje podnetog zahteva.

Faze uredi

Kako su istraživanja na polju pretraživanja obrazovnih podataka nastavila da rastu, bezbroj tehnika pretraživanja podataka primenjeno je u različitim obrazovnim kontekstima. U svakom od ovih slučajeva, glavni cilj je prevesti neobrađene podatke u korisne informacije o procesu učenja, kako bi se donele bolje odluke o planu i putanji okruženja za učenje. Dakle, EDM se obično sastoji od četiri faze: [2] [4]

  1. Prva faza EDM procesa (ne računajući prethodnu obradu) je otkrivanje veza među podacima. To uključuje pretragu kroz repozitorijum podataka iz obrazovnog okruženja, s ciljem pronalaženja postojanih odnosa između promenljivih . Korišćeno je nekoliko algoritama za identifikovanje takvih odnosa, uključujući klasifikovanje, regresiju, klasterizaciju, analizu faktora, analizu društvenih mreža, pretraživanje pravila udruživanja i sekvencijalno pretraživanje uzoraka .
  2. Otkriveni odnosi moraju biti potvrđeni, kako bi se izbeglo prekomerno prilagođavanje .
  3. Proverene veze se potom koriste za predviđanje budućih događaja u okruženju za učenje.
  4. Predviđanja se koriste da podrže procese donošenja odluka i politiku donošenja odluka.

Tokom treće i četvrte faze podaci se često vizualizuju ili na neki drugi način filtriraju, da bi bili spremni za ljudsko prosuđivanje. [2] Velika količina istraživanja je sprovedena u najboljim praksama za vizuelizaciju podataka .

Glavni pristupi uredi

Od opštih kategorija gore pomenutih metoda, predviđanje, nagomilavanje konstrukcija i pretraživanje podataka, smatraju se univerzalnim metodama u svim vrstama pretraživanja podataka; međutim, Otkrivanje uz pomoć modela i Destilacija podataka za ljudsko vrednovanje, smatraju se istaknutijim pristupima u okviru pretraživanja obrazovnih podataka. [6]

Otkriće uz pomoć modela uredi

Uz pomoć metode Otkrivanje pomoću modela, model se razvija predviđanjem, grupisanjem ili upravljanjem znanja uz pomoć ljudskog rasuđivanja, a zatim njihov korišćenjem kao komponenti u nekoj daljoj analizi, naime u predviđanju i pretraživanju odnosa između njih. [6] U metodi predviđanja, kreiran model se koriste za predviđanje nove promenljive . Za upotrebu pretraživanja odnosa, stvoreni model nam omogućava analizu između novih predviđanja i dodatnih promenljivih u učenju. U mnogim slučajevima, otkrivanje uz pomoć modela koristi već utvrđene modele predviđanja, koji su već dokazali karakteristiku uopštavanja u različitim kontekstima.

Ključne primene ove metode uključuju otkrivanje odnosa između ponašanja učenika, karakteristika i kontekstualnih promenljivih u okruženju za učenje. [6] Dalje otkrivanje opštih i specifičnih istraživačkih pitanja kroz širok spektar konteksta takođe se može istražiti uzv pomoć baš ove metode.

Filtriranje podataka za prosuđivanje uredi

Ljudi mogu donositi zaključke o podacima koji mogu biti izvan opsega koji pruža automatizovana metoda traženja podataka . [6] Za svrhu traženja obrazovnih podataka, podaci za ljudsko prosuđivanje su podeljeni na osnovu dve ključne uloge: identifikacije i klasifikacije .

U cilju identifikacije, podaci se filtriraju kako bi se ljudima omogućilo da uoče dobro poznate šablone, koji bi inače mogli da budu teški za prevođenje. Na primer, kriva učenja, klasična za obrazovne studije, je obrazac koji veoma lepo oslikava odnos između učenja i iskustva koje se stiče tokom vremena.

Podaci se takođe izdvajaju u svrhe klasifikovanja karakteristika podataka, koji se za obradu obrazovnih podataka koriste za podršku razvoju modela predviđanja. Klasifikacija izuzetno pomaže ubrzavanju razvoja modela predviđanja.

Cilj ove metode je da sumira i prikaže informacije na koristan, interaktivan i vizuelno privlačan način kako bi se razumele velike količine podataka o obrazovanju i podržalo donošenje odluka . [8] Ova metoda je naročito korisna za nastavnike u razumevanju informacija o upotrebi i efikasnosti u aktivnostima na kursu. Ključne aplikacije za destilaciju podataka za ljudsku prosudbu uključuju prepoznavanje obrazaca u učenju učenika, ponašanja, mogućnosti za saradnju i označavanje podataka za buduću upotrebu u modelima predviđanja. [6]

Aplikacije uredi

Spisak primarnih primena EDM-a pružaju Kristofer Romero i Sebastijan Ventura. [4] U njihovoj taksonomiji, područja primene EDM-a su:

  • Analiza i vizuelizacija podataka
  • Pružanje povratnih informacija za instruktore koji podržavaju
  • Preporuke studentima
  • Predviđanje uspeha učenika
  • Modelovanje učenika
  • Otkrivanje neželjenog ponašanja učenika
  • Grupisanje učenika
  • Analiza društvene mreže
  • Izrada konceptualnih mapa
  • Izrada programa za učenje - EDM se može primeniti na sisteme za upravljanje kursevima kao što je Moodle otvorenog koda. Moodle sadrži podatke o upotrebi koji uključuju razne aktivnosti korisnika, kao što su rezultati testova, količina završenih čitanja i učešće na forumima za diskusiju . Alati za rudarenje podacima mogu se koristiti za prilagođavanje aktivnosti učenja svakom korisniku i prilagođavanje tempa kojim student završava kurs. Ovo je posebno korisno za onlajn kurseve sa različitim nivoima kompetencija.
  • Planiranje i zakazivanje

Novo istraživanje o mobilnim okruženjima za učenje takođe sugeriše da istraživanje podataka može biti korisno. Iskopavanje podataka može se koristiti za pružanje personalizovanog sadržaja mobilnim korisnicima, uprkos razlikama u upravljanju sadržajem između mobilnih uređaja i standardnih računara i veb pregledača .

Nove EDM aplikacije fokusiraće se na omogućavanje netehničkim korisnicima da koriste i uključuju se u alate i aktivnosti za rudarenje podataka, čineći prikupljanje i obradu podataka pristupačnijim za sve korisnike EDM-a. Primeri uključuju statističke i vizuelne alate koji analiziraju društvene mreže i njihov uticaj na ishode učenja i produktivnost. [13]

Kursevi uredi

  1. U oktobru 2013. godine, Coursera je ponudila besplatni onlajn kurs na temu „Veliki podaci u obrazovanju“ koji je podučavao kako i kada treba koristiti ključne metode za EDM. [14] Ovaj kurs se preimenovan u edX u leto 2015. godine, [15] i od tada nastavlja da se prikazuje na godišnjem nivou. Arhivi kurseva se sada može prostupiti elektronskim putem. [16]
  2. Teachers College, Columbia University nudi master program u oblasti Analitike učenja. [17]

Mesto izdavanja uredi

Znatan deo EDM rada objavljen je na recenziranoj Međunarodnoj konferenciji o rudarstvu podataka o obrazovanju, koju je organizovalo Međunarodno društvo za istraživanje podataka o obrazovanju .

EDM radovi su takođe objavljeni u Journal of Educational Data Mining (JEDM).

Mnogi EDM radovi se rutinski objavljuju na srodnim konferencijama, kao što su veštačka inteligencija i obrazovanje, inteligentni sistemi podučavanja i modeliranje korisnika, prilagođavanje i personalizacija .

2011. godine, Chapman & Hall / CRC Press, Tailor i Francis Group objavili su prvi Priručnik o rudarstvu obrazovnih podataka. Ovaj resurs je stvoren za one koji su zainteresovani za učešće u zajednici obrazovnih podataka. [13]

Takmičenja uredi

U 2010. godini održan je KDD kup Udruženja za računarske mašine koristeći podatke iz obrazovnog okruženja. Skup podataka obezbedio je Pittsburgh Science of Learning Center's DataShop a sastojao se od preko 1.000.000 tačaka podataka učenika koji su koristili kognitivnog tutora. Šest stotina timova nadmetalo se za preko 8.000 USD novčane nagrade (koju je donirao Fejsbuk). Cilj takmičara bio je da osmisle algoritam koji bi, nakon učenja iz pruženih podataka, napravio najtačnija predviđanja na osnovu novih podataka. Pobednici su predali algoritam koji je koristio generisanje karakteristika (oblik učenja predstavljanja), slučajne šume i bajesove mreže .

Troškovi i izazovi uredi

Uz tehnološki napredak povezani su i troškovi i izazovi povezani sa primenom EDM aplikacija. To uključuje troškove skladištenja evidentiranih podataka i troškove povezane sa angažovanjem osoblja posvećenog upravljanju sistemima podataka. [18] Štaviše, sistemi podataka se možda neće uvek neprimetno integrisati, pa čak i uz podršku statističkih i vizuelnih alata, stvaranje pojednostavljene verzije podataka može biti teško. Štaviše, odabir podataka za rukovanje i analizu takođe može biti izazov što početne faze čini vrlo dugotrajnim i radno intenzivnim. Od početka do kraja, EDMstrategija i primena zahteva da se pridržavaju privatnosti i etike za sve uključene zainteresovane strane.

Kritike uredi

  • Generalizacija - Istraživanje u EDM-u može biti specifično za određenu obrazovnu postavku i vreme u kojem je istraživanje sprovedeno, i kao takvo, možda neće biti uopšteno za druge institucije. Istraživanje takođe ukazuje da je polje vađenja obrazovnih podataka koncentrisano u zapadnim zemljama i kulturama, a posle toga druge zemlje i kulture možda neće biti predstavljene u istraživanju i nalazima. [7] Razvoj budućih modela treba da razmotri primenu u više konteksta.
  • Privatnost - Privatnost privatnika je stalna briga za primenu alata za rudarenje podacima. Uz besplatne, pristupačne i korisničke alate na tržištu, studenti i njihove porodice mogu biti u opasnosti zbog informacija koje učenici pružaju sistemu učenja, u nadi da će dobiti povratne informacije koje će im biti od koristi u budućnosti. Kako korisnici postaju pametni u razumevanju privatnosti na mreži, administratori obrazovnih alata za rudarenje podataka moraju biti proaktivni u zaštiti privatnosti svojih korisnika i biti transparentni o tome kako i s kim će se informacije koristiti i deliti. Razvoj EDM alata treba da razmotri zaštitu privatnosti pojedinaca, a da istovremeno unapređuje istraživanje u ovoj oblasti.
  • Plagiranje - Otkrivanje plagijara stalni je izazov za nastavnike i nastavnike bilo u učionici ili na mreži. Međutim, zbog složenosti povezane sa otkrivanjem i sprečavanjem digitalnog plagijarizma, alati za obradu obrazovnih podataka trenutno nisu dovoljno sofisticirani da bi se tačno rešili ovaj problem. Stoga bi razvoj prediktivnih sposobnosti u pitanjima vezanim za plagijarizam trebalo da bude fokus u budućim istraživanjima.
  • Usvajanje - Nepoznato je koliko je široko prihvaćeno EDM i u kojoj meri su institucije primenile i razmatrale sprovođenje strategijeEDM. Kao takvo, nejasno je da li postoje prepreke koje sprečavaju korisnike da usvoje EDM u svojim obrazovnim postavkama.

Vidi još uredi

Reference uredi

  1. ^ „EducationalDataMining.org”. 2013. Pristupljeno 2013-07-15. 
  2. ^ a b v R. Baker (2010) Data Mining for Education. In McGaw, B., Peterson, P., Baker, E. (Eds.) International Encyclopedia of Education (3rd edition), vol. 7, pp. 112-118. Oxford, UK: Elsevier.
  3. ^ G. Siemens, R.S.j.d. Baker (2012). „Learning analytics and educational data mining: towards communication and collaboration”. Proceedings of the 2nd International Conference on Learning Analytics and Knowledge: 252—254. 
  4. ^ a b v C. Romero, S. Ventura. Educational Data Mining: A Review of the State-of-the-Art. IEEE Transactions on Systems, Man, and Cybernetics, Part C: Applications and Reviews. 40(6), 601-618, 2010.
  5. ^ "http://educationaldatamining.org/EDM2008/" Retrieved 2013-09-04
  6. ^ a b v g d đ Baker, Ryan. „Data Mining for Education” (PDF). oxford, UK: Elsevier. Pristupljeno 9. 2. 2014. 
  7. ^ a b Baker, R.S.; Yacef, K (2009). „The state of educational data mining in 2009: A review and future visions”. JEDM-Journal of Educational Data Mining. 1 (1): 2017. 
  8. ^ a b Romero, Cristobal; Ventura, Sebastian (January—February 2013). „WIREs Data Mining Knowl Discov”. Wiley Interdisciplinary Reviews: Data Mining and Knowledge Discovery. 3 (1): 12—27. doi:10.1002/widm.1075.  Proverite vrednost paramet(a)ra za datum: |date= (pomoć)
  9. ^ Romero, Cristobal; Ventura, Sebastian (2007). „Educational data mining: A survey from 1995 to 2005”. Expert Systems with Applications. 33 (1): 135—146. doi:10.1016/j.eswa.2006.04.005. 
  10. ^ „Assessing the Economic Impact of Copyright Reform in the Area of Technology-Enhanced Learning”. Industry Canada. Arhivirano iz originala 13. 4. 2014. g. Pristupljeno 6. 4. 2014. 
  11. ^ Azarnoush, Bahareh, et al. "Toward a Framework for Learner Segmentation." JEDM-Journal of Educational Data Mining. . 5 (2). 2013: 102—126.  Nedostaje ili je prazan parametar |title= (pomoć).
  12. ^ U.S. Department of Education, Office of Educational Technology. „Enhancing Teaching and Learning Through Educational Data Mining and Learning Analytics: An Issue Brief” (PDF). Arhivirano iz originala (PDF) 11. 6. 2014. g. Pristupljeno 30. 3. 2014. 
  13. ^ a b Romero, C; Ventura, S.; Pechenizkiy, M.; Baker, R. S. (2010). Handbook of educational data mining. CRC Press. 
  14. ^ „Big Data in Education”. Coursera. Pristupljeno 30. 3. 2014. 
  15. ^ „Big Data in Education”. edXedxed. Pristupljeno 13. 10. 2015. 
  16. ^ „Big Data in Education”. Pristupljeno 17. 7. 2018. 
  17. ^ „Learning Analytics | Teachers College Columbia University”. www.tc.columbia.edu. Pristupljeno 2015-10-13. 
  18. ^ „How Can Educational Data Mining and Learning Analytics Improve and Personalize Education?”. EdTechReview. Pristupljeno 9. 4. 2014.