Disperzija ili varijansa je pojam iz teorije verovatnoće i statistike. Ona predstavlja matematičko očekivanje odstupanja slučajne promenljive od njene srednje vrednosti. Varijansa je mera disperzije, što znači da izražava koliko je skup brojeva raširen od njihove prosečne vrednosti. Varijansa ima centralnu ulogu u statistici, gde neke ideje koje je koriste uključuju deskriptivnu statistiku, statističko zaključivanje, testiranje hipoteze, adekvatnost uklapanja i Monte Karlo uzorkovanje. Varijanca je važan alat u nauci, gde je uobičajena primena statističke analize podataka. Varijanca je kvadrat standardne devijacije, drugi centralni momenat distribucije i kovarijansa slučajne promenljive sa samom sobom, a često se predstavlja sa , , , , ili .[1]

Primer uzoraka iz dve populacije sa istom srednjom vrednošću, ali različitim varijacijama. Crvena populacija ima srednju vrednost 100 i varijansu 100 (SD=10), dok plava populacija ima srednju vrednost 100 i varijansu 2500 (SD=50).

Na primer, savršena kocka za igru može da da jedan od 6 ishoda. Očekivana vrednost broja kojeg će kocka da pokaže je (1 + 2 + 3 + 4 + 5 + 6)/6 = 3,5, očekivana standardna devijacija je σ ≈ 1.71 (kvadratni koren aritmetičke sredine jednakoverovatnih kvadrata apsolutnih odstupanja: 3,5 − 1, 3,5 − 2, 3,5 − 3, 4 − 3,5, 5 − 3,5, 6 − 3,5, što daje 2,5, 1,5, 0,5, 0,5, 1,5, 2,5), očekivano kvadratno odstupanje ili varijansa je  17,5/6 ≈ 2,9 (srednja vrednost jednakoverovatnih kvadrata odstupanja: 2,52, 1,52, 0,52, 0,52, 1,52, 2,52).

Definicija uredi

Neka je   matematičko očekivanje realnog slučajnog vektora   za koji postoji integral kvadrata njegovih vrednosti. Tada je varijansa slučajne promenljive:

 

Ako je vektor   jednodimenzionalan, uslovi za   mogu da se uproste. Ako je  , onda važi:

 

Ova definicija obuhvata slučajne varijable koje su generisane procesima koji su diskretni, kontinuirani, ni jedno ni drugo ili mešoviti. Varijansa se takođe može smatrati kovarijansom slučajne promenljive sa samom sobom:

 

Varijansa je takođe ekvivalentna drugom kumulantu distribucije verovatnoće koja generiše  . Varijansa se obično označava kao  , ili ponekad kao   ili  , ili simbolično kao   ili jednostavno   (izgovara se „sigma na kvadrat”). Izraz za varijansu se može proširiti na sledeći način:

 

Drugim rečima, varijansa X je jednaka srednjoj vrednosti kvadrata X minus kvadrat srednje vrednosti X. Ova jednačina ne bi trebalo da se koristi za proračune korišćenjem aritmetike sa plutajućim zarezom, jer pati od katastrofalnog poništavanja ako su dve komponente jednačine slične po veličini. Za druge numerički stabilne alternative pogledajte algoritme za izračunavanje varijanse.

Diskretna slučajna promenljiva uredi

Ako je generator slučajne promenljive   diskretan sa funkcijom verovatnoće  , onda je

 

gde je   očekivana vrednost. To je,

 

(Kada je takva diskretna ponderisana varijansa određena ponderima čiji zbir nije 1, tada se deli zbirom pondera.)

Varijanca kolekcije od   jednako verovatnih vrednosti može se napisati kao

 

gde je   prosečna vrednost. To je,

 

Varijanca skupa od   jednako verovatnih vrednosti može biti ekvivalentno izražena, bez direktnog pozivanja na srednju vrednost, u smislu kvadrata odstupanja svih tačaka jedne od druge:[2]

 

Apsolutno kontinuirana slučajna promenljiva uredi

Ako randomna promenljiva   ima funkciju gustine verovatnoće  , i   je korespondirajuća kumulativna funkcija raspodele, onda je

 

ili ekvivalentno,

 

gde je   očekivana vrednost od   data sa

 

U ovim formulama, integrali u odnosu na   i   su Lebesgov i Lebesg–Stiltjeov integral, respetivno.

Ako je funkcija   integrabilna po Rimanu na svakom konačnom intervalu   onda je

 

pri čemu je ovaj integral nepravilan Rimanov integral.

Primeri uredi

Eksponencijalna distribucija uredi

Eksponencijalna raspodela sa parametrom λ je kontinuirana raspodela čija je funkcija gustine verovatnoće data sa

 

na intervalu [0, ∞). Može se pokazati da je njegova srednja vrednost

 

Koristeći integraciju po delovima i upotrebljavajući očekivanu vrednost koja je već izračunata, dobija se:

 

Stoga je varijansa od X data izrazom

 

Bacanje kocke uredi

Šestostrana koca se može modelovati kao diskretna randomna promenljiva, X, sa ishodima od 1 do 6, svaki sa jednakom verovatnoćom 1/6. Očekivana vrednost X je   Dakle, varijansa X je

 

Opšta formula za varijansu ishoda, X, n-strane kocke je

 

Često korišćene distribucije verovatnoće uredi

Sledeća tabela navodi varijansu za neke često korišćene distribucije verovatnoće.

Naziv raspodele verovatnoće Funkcija raspodele verovatnoće Aritmetička sredina Varijansa
Binomna raspodela      
Geometrijska raspodela      
Normalna raspodela      
Uniformna raspodela (kontinuirana)      
Eksponencijalna raspodela      
Poasonova raspodela      

Reference uredi

  1. ^ Wasserman, Larry (2005). All of Statistics: a concise course in statistical inference. Springer texts in statistics. str. 51. ISBN 9781441923226. 
  2. ^ Yuli Zhang; Huaiyu Wu; Lei Cheng (jun 2012). Some new deformation formulas about variance and covariance. Proceedings of 4th International Conference on Modelling, Identification and Control(ICMIC2012). str. 987—992. 

Literatura uredi

Spoljašnje veze uredi