Poslednjih godina u oblasti učenja i pamćenja dešavaju se revolucionarne promene koje izražavaju veliko oduševljenje ali i kontroverze. One odražavaju razvoj ideja zasnovanih na pretpostavci o paralelnoj obradi informacije koja je raspodeljena na mnogo jedinica, a koja je poznata pod nazivom paralelno raspodeljena obrada ili konekcionizam.[1][2][3]

Koreni konekcionizma — Teorija učenja uredi

Ranih godina ovog veka, Edvard Torndajk je predložio niz opštih principa učenja koje je nazvao „konekcionizam“. Njima se, u osnovi, pretpostavljalo da se učenje odvija kroz niz pokušaja ili pogrešaka. Uzastopni takvi koraci formiraju asocijativne veze i one veze koje je pratila nagrada bivaju ojačane ili pozitivno potkretljene, čime se povećava verovatnoća da se, nakon što se izvede prvi, izvede i drugi korak, što se naziva zakonom efekta. Jedan ovako opšti pojam poseduje privlačnost koju trpi iz sličnosti sa procesom prirodne selekcije koji se odvijao tokom evolucije, jer se navike koje su dovodile do nagrade postepeno odabiraju, dok one koje nisu otpadaju.

Neka od najvećih neslaganja ispoljila su se se između teoretičara kakav je bio Klark L. Hal, koji je pokušao da pronađe skup detaljnih principa učenja zasnovanih na pojmovima asocijacije i potkrepljenja i Edvarda C. Tolmana koji je naglašavao značaj unutrašnjih reprezentacija, ili kongnitivnih mapa, u učenju.

A onda sredinom pedesetih godina, prilično iznenadno interesovanje za ovu oblast se iznenada izgubilo.

Poslednji tragovi interesovanja za opšte modele učenja koji se mogu opaziti u ljudskoj eksperimentalnoj psihologiji posledica su kontroverze koja je pratila razvoj matematičkog modelovanja učenja, do koga je došlo tokom šezdesetih godina. Matematičko modelovanje odnosilo se na pitanje da li učenje treba posmatrati kao proces promene jačine asocijacija tipa sve-ili-ništa, ili kao proces postepenog učenja asocijativne veze.

Računar kao model uredi

„Učenje“ računara podrazumeva snimanje informacije na određenu lokaciju, dok „izvlačenje“ uključuje vraćanje na tu lokaciju i iščitavanje informacije koja je tamo pohranjena. Ukoliko je na raspolaganju dovoljan broj lokacija, pohranjivanje informacije je trivijalno lako, zaboravljanje zanemarljivo, a izučavanje je tipa sve-ili-ništa, što sve nije slučaj sa ljudskom memorijom. Kod računara ove vrste prisećanje je ili kompletno, izvedeno do detalja ispravno, ili ga uopšte nema. Nasuprot tome, izvlačenje radi reprodukovanja je, po pravilu, delimično a zaboravljanja ima u značajnom iznosu. Glavne vrline ljudskog pamćenja su, sa druge strane, u brzini i fleksibilnosti pristupa materijalu i u njegovoj sposobnosti apstrakcije, koja omogućuje brz pristup suštini kompleksnih ranije stečenih iskustava.

Ono što je navažnije je to što je mozak sačinjen od velikog broja jedinica (neurona) koji deluju paralelno, pre nego redno, što je slučaj sa većinom postojećih računara. Brzina rada neurona u mozgu je znatno manja od one koju postižu komponente savremenih računara, pa ipak, mozak je u stanju da prilikom crpljenja memorije postigne mnogo više od prosečnog računara. Ovo je verovatno posledica paralelnog funkcionisanja neurona, koji sadejstvuju sa drugima i često operišu približnim rešenjima pre nego kompletno definisanim operacijama.

Možda upravo zbog toga, mozak poseduje sposobnost takozvane postepene gradacije. Mozak, na nivou neurona, nastavlja da radi na približno isti način, čak i onda kada izgubi veliki broj nervnih ćelija, kao prilikog normalnog starenja ili oštećenja nastalog usled, na primer, udarca u glavu. Mašine koje rade serijski, uključujući tu i serijske računare, vrlo su sklone otkazivanju ukoliko bilo koji njihov deo zakaže. To, na sreću nije slučaj sa ljudskim mozgom, niti sa procesima pretrage ljudskog pamćenja i rešavanja problema.

Perceptroni i paralelna obrada uredi

 
Primer ulaza

Računari sadašnje generacije deluju tako što redno manipulišu simbolima, koji sa svoje strane predstavljaju reprezentacije podataka. Takav pristup računarstvu je vrlo različit od načina na koji funkcioniše mozak. Zašto onda ljudi razvijaju serijske umesto paralelnih sistema? Program za prepoznavanje vizuelnih složaja Olivera Selfridža poznat kao Pandemonijum1 je primer, a sličan prestavlja i mašina za paralelnu obradu Rozenbalta, koju je on nazvao perceptron.

Perceptron je jednostavna naprava koja povezuje detektorsku jedinicu koja je analogna mrežnjači oka sa nizom ulaznih jedinica, koja sa svoje strane mogu aktivirati izlazne jedinice, izazivajući tako odgovor.

I ulazne i izlazne jedinice imaju svoj prag, što znači da je neophodno da aktivnost pređe određeni minimalni nivo pre nego što okinu. Okidanje dovodi do povećanja verovatnoće okidanja izlazne jedinice (ekscitacija) ili izaziva negativan efekat (inhibicija). Jačina ovog efekta zavisiće od ponderisanja veze po kojoj se radi. Konačno, da li će izlazna jedinica okinuti ili neće zavisiće od njenog praga i toga da li suma ponderisanih vrednosti ulaza prelazi tu vrednost.

Ovakve sprave mogu, naravno, biti znatno složenije i, važnije, mogu da budu napravljene tako da uče dajući perceptornu povratnu informaciju o njegovom učinku. Ovo se može postići ako se sledi jednostavan princip: ukoliko perceptron odgovara pogrešno da je određen složaj prisutan tamo gde ga nema, to znači da je redukovana jačina veza između svih jedinica koje su u tom trenutku aktivne. Ukoliko, sa druge strane, perceptron ne uspe da detektuje željeni složaj kada je ovaj prisutan, tada svi aktuelni nivoi ekscitacije bivaju povišeni. To postepeno dovodi do situacije u kojoj perceptron automatski odgovara kada je sadržaj prisutan ali ne i kada je odsutan.

Na nesreću, postoje ograničenja u onome što je jednostavan perceptron u stanju da nauči. Jedan primer za to predstavlja problem učenja jednostavne mašine poput one prikazane na slici da odgovori kada je prikazano ili jedan ili nula, ali ne i kada je prikazano i jedno i drugo.

Jedan naćin da se problem reši jeste da se uvede treća vrsta jedinica, „Skrivene jedinice“, koja okida samo onda kada je stimulišu i jedan i nula jedinice i koja kada okine, inhibiše jedinicu za emitovanje odgovora kako je prikazano na slici.

 
Konekcionizam

U tom primeru, skrivena jedinica ima prag od 1,5 ekscitacije, te neće okinuti ni sa jednim ulazom pojedinačno, već samo onda kada je istovremeno stimulisana sa oba. Efekat delovanja skrivene jedinice jeste inhibisanje izlazne jedinice, te ona stoga u stanju da poništi ekscitatorne efekte dva ulaza. Usled toga sistem će reagovati na ulaz jedan ili ulaz nula ali ne i na njihovu istovremenu prezentaciju.

Potencijalna vrednost skrivenih jedinica bila je poznata Rozenbaltu, ali ona nije mogla biti ekspoatisana dugi niz godina jednostavno stoga što je bilo teško naći način na koji bi takve skrivene jedinice mogle da „uče“. Poslednjih godina ispituje se veći broj potencijalnih procesa učenja, a jedan od njih je povratno širenje greške.

Pandemonijum uredi

Uticaj ideja o paralelnoj obradi seže u najmanju ruku u pedesete godine, doba pojave Selfidžovog modela pandemonijuma. Ovaj model pretpostavlja postojanje hijerarhije jedinica za detekciju ili „demona“ , od kojih je svaki specijalizovan za sopstveni zadatak detekcije. Selfridž je tvrdio da se kombinovanjem odluka pojedinačnih demona može proizvesti vrlo efikasna naprava za detekciju vizuelnih sadržaja.

 
Kognitivni demoni

Razmotrimo, na primer, problem čitanja reči. Demoni najnižeg nivoa trebalo bi da identifikuju linije koje čine slova. Jedan demon bi, na primer, mogao biti zadužen za detektovanje vertikalnih linija; kada detektuje takvu liniju, njegov posao je da to dovikne demonu koji se nalazi iznad njega. Taj demon iznad mogao bi biti zadužen za obradu segmenata koji obuhvataju više od jedne linije, to jest, mogao bi, na primer, biti specijalista za detektovanje slova N. Takvog ohrabrivale bi ga i uzvik demona zaduženih za vertikalne i onih koji su zaduženi za horizontalne linije, ali bi ga obeshrabrivali uzvici demona koji reprezentuju zakrivljene ili kose linije.

Adresabilnost sadržaja uredi

Memorija čiji sadržaj je adresabilan je ona u kojoj se sadržaju pristupa tako što se daje delimičan opis tog sadržaja a memorijski sistem obezbeđuje ostalo. Studija Mek Klilenda (1981) ilustruje način na koji se slična paralelno raspodeljena arhitektura može upotrebiti za pohranjivanje informacije o stanovnicima prilično nezdaravog za život, fiktivnog predgrađa u Americi. Tabela 1 prikazuje imena članova dve bande, zajedno sa stepenom njihovog obrazovanja, starošću, bračnim statusom i zanimanjem.

 
Tabela

Slika prikazuje neke od jedinica i uzajamnih veza uključenih u reprezentovanje članova dve bande. Dvostruke strelice označavaju uzajamnu ekscitaciju, dok se jedinice koje pripadaju istom „obliku“ uzajamno inhibišu. Davanje jedne informacije pobuđuje ostale. Tako, ukoliko imamo ime „Sem“, širenje aktivacije će ukazivati da je on dvadesetih godina, knjigovođa, oženjen pripadnik Džetsa, i da je fakultetski obrazovan. Umesto toga, mogu se navesti neka svojstva i pobuditi ime – “ko je u svojim četrdesetim i diler je droge?“ – nakon čega će se ukazati ime Art, zajedno sa ostalim činjenicama, da je član Džetsa i da je završio prva dva razreda srednje škole.

Jedno od svojstava takvog sistema jeste postepena degradacija, tako da kada jedan segment informacije bude izbrisan, sistem, umesto da se potpuno raspadne, daje najbolju moguću procenu. Analogna vrlina mreže ove vrste sastoji se u tome što je ona u stanju da, u slučaju kada informacija nije neposredno specifikovana, umesto nje obezbedi tipičnu vrednost. Takav odgovor naravno ne mora biti tačan, već samo predstavlja razumno nagađanje. Još jedno svojstvo ovakvih mreža je to da su u stanju da izvode spontane generalizacije. Stereotip će posedovati karakterisike, čak i ako se ni jedan postojeći pojedinac ne uklapa u takav stereotip. Tamo gde su karakteristike ravnomerno raspoređene što je slučaj sa zanimanjem, one se međusobno poništavaju. Dakle, modeli ove vrste ne samo da nude prednosti memorije čiji je sadržaj adresabilan, već je takođe u stanju da nadoknadi vrednosti koje nedostaju i izvede opšte stereotipe. Sve ovo su naravno, svojstva ljudskog pamćenja.

Veći deo aktuelne generacije ekspertnih sistema zasnovan je na metodi produkcionog sistema (Newel & Simon, 1972). Ovaj metod modelovanja podrazumeva specifikovanje niza pravila računara. Ona sa svoje strane mogu biti prikupljena od ljudi – stručnjaka, postupkom koji se naziva „žetvom znanja“. Glavni problem sa ovom procedurom sastoji se u tome što stručnjaci često nisu svesni pravila koja primenjuju. I zbilja, konekcionisti imaju pravo da tvrde da je to zato što su sama pravila fiktivna, da su generalizacije koje imaju za cilj da opišu procese koji, u stvari, nisu zasnovani na pravilima. Prednost konekcionističke mašine je u tome da njoj nije potrebno specifikovati pravila; ukoliko su poznati ulaz, tj stimulacija, i željeni odgovor, ona sama može da razradi njihov odnos.

Pajlišin (Pylyshin, 1984), razlikuje kognitivne sisteme koji su „transparentni“ ili „penetrabilni“ i one koji su „neprozirni“, odnosno „nepenetrabilni“. Transparentni sistem je onaj po kome možemo steći uvide putem introspekcije, i koji se mogu putem promišljanja modifikovati. Usmeravanje pažnje na violinski umesto na vokalni deo muzičkog dela, ili odabiranje i primena određene strategije za učenje ili izvlačenje primeri su delovanja transparentnih kognitivnih sistema.

Ostali delovi našeg kognitivnog aparata su, nama jednostavno nedostupni, mi niti možemo da posmatramo, niti da kontrolišemo njihovo delovanje. Očigledni primeri za to predstavljaju periferijske aktivnosti kakvi su refleksni mehanizmi uz pomoć kojih se kontroliše količina svetlosti koja pada na oko, prilagođavanjem dužice, ili proces putem koga podiže nivo adrenalina u krvi u pretećoj situaciji. Tu bi takođe spadali složeniji mehanizmi, poput onih koji su odgovorni za stereoskopko opažanje dubine i verovatno procedure koje su uključene u automatsko izvlačenje informacija iz dugoročne memorije.

Moguće je da su konekcionistički modeli podobni za neprozirne procese, koji deluju na relativno automatizovan način, dok modeli zasnovani na simboličkoj obradi i dalje imaju bolja objašnjenja onih aspekata kognicije koji su transaparentni i otvoreni za svesnu manipulaciju i kontrolu. Radna memorija, kako sada izgleda, deluje na granici između neprozirnog i transparentnog.

Pregled uredi

Konekcionizam, pristup koji po pravilu počiva na paralelno raspodeljenoj obradi informacije. U velikoj meri se oslanja na kompjutersku simulaciju, ali se razlikuje od većine kompjuterskih modela. Tim modelima se, po pravilu, pretpostavljalo postojanje niza odvojenih stadijuma, dok se konekcionizam, po pravilu, zalaže za modele unutar kojih veliki broj jednostavnih jedinica deluje uporedno.

Primenom opisanih sistema moguće je raspodeliti učenje na mnogo jedinica. To pruža prednost memorijskog skladištenja koje je znatno sličnije delovanju ljudskog mozga nego memorisanju običnog računara. Memorija običnog računara omogućuje savršeno izvlačenje kada se pozove odgovarajuća adresa, a nikakvo kada se to ne učini, što nije slučaj sa ljudskom memorijom, koja je često delimična i fragmentisana. Delimično prisećanje i generalizacija prirodna su svojstva nekih od paralelno raspodeljenih reprezentacija. Ovakvi modeli takođe sadrže svojstvo adresabilnosti sadržaja, uz pomoć koga učitavanje dela materijala kojeg se treba prisetiti pobuđuje njegov ostatak, što je, ponovo, svojstvo ljudskog pamćenja. Konačno, baš kao i u slučaju ljudskog pamćenja, ovakvi modeli poseduju sposobnost postepene degradacije, što znači da zaboravljanje, ili možda čak i oštećenje sistema, dovodi do slabije reprodukcije izvornog materijala, pre nego do potpunog ostranjivanja nekih i potupnog očuvanja njegovih drugih delova.

Reference uredi

  1. ^ Selfridge, O.G. (1955). Pattern recognition and modern computers. Proceedings of the Western Joint Computer Conference, New York: Institute of Electrical and Electronics Engineers.
  2. ^ Selfridge, O.G. (1960). Pattern recognition by machine. Scientific American, 203, 60 - 68.
  3. ^ Rosenblatt, F. (1962) Principles of neurodynamics. New York: Spartan

Literatura uredi

  • McClelland, J.L., & Rumelhart, D.E. & Hinton, G.E. (1981). An interactive activation model of context effects in letter perception: Part I. An account of basic findings. Psyhological Review, 88, 375 - 407.
  • Newell, A., & Simon, H.A. (19720. Human problem soloving. Englewood Cliffs, NJ: Prentice-Hall.
  • Pylyshin, Z.W. (1984). Computation and cognition: Toward a foundation for cognitive science. Cambridge, MA: Bradford Books, MIT Press.