U statističkom testiranju hipoteze, p-vrednost (engl. probability value) ili vrednost verovatnoće, za dati statistički model verovatnoća je da će, kada je nulta hipoteza tačna, statistički parametar (kao što je apsolutna vrednost prosečne razlike između dve upoređene grupe) biti veći ili jednak stvarno uočenom rezultatima.[1] Upotreba p-vrednosti u testiranju statističkih hipoteza je uobičajena u mnogim oblastima istraživanja[2] kao što su fizika, ekonomija, finansije, političke nauke, psihologija,[3] biologija, krivično pravo, kriminologija i sociologija.[4] Zloupotreba p-vrednosti je kontroverzna tema u metanauci.[5]

Zakošavanje slova, upotreba velikih slova i deljenja reči variraju. Na primer, AMA stil koristi „P vrednost”, APA stil koristi „p vrednost”, a Američko statističko udruženje koristi „p-vrednost”.[6]

Definicija i interpretacija уреди

Definicija уреди

Verovatnoća pod nultom hipotezom dobijanja statistike testa sa realnom vrednošću koja je najmanje ekstremna kao i dobijena уреди

Uzmimo u obzir posmatranu statistiku testa   iz nepoznate distribucije  . Tada je p-vrednost   ono što bi bila prethodna verovatnoća da se posmatra statistička vrednost testa barem tako „ekstremna” kao   ako je nulta hipoteza   bila istinita. To je:

  •   za jednostranu distribuciju test statistike na desni rep,
  •   za jednostranu distribuciju test statistike sa leve strane,
  •   za dvostranu distribuciju test-statistike. Ako je raspodela   simetrična oko nule, onda je  

Tumačenja уреди

p-vrednost kao statistika za izvođenje testova značajnosti уреди

U testu značaja, nulta hipoteza   se odbacuje ako je p-vrednost manja ili jednaka unapred definisanoj graničnoj vrednosti  , koja se naziva alfa nivo ili nivo značajnosti.   nije izvedeno iz podataka, već ga postavlja istraživač pre ispitivanja podataka.   se obično postavlja na 0,05, mada se ponekad koriste niži nivoi za alfa. U 2018. godini, grupa statističara na čelu sa Danijelom Bendžaminom predložila je usvajanje vrednosti od 0,005 kao standardne vrednosti za statističku značajnost širom sveta.[7]

Distribucija уреди

Kada je nulta hipoteza tačna, ako ima oblik  , a osnovna slučajna promenljiva je kontinuirana, onda je raspodela verovatnoće p-vrednosti uniformna na intervalu [0,1]. Nasuprot tome, ako je alternativna hipoteza tačna, distribucija zavisi od veličine uzorka i prave vrednosti parametra koji se proučava.[2][8]

Distribucija p-vrednosti za grupu studija se ponekad naziva p-kriva.[9] p-kriva se može koristiti za procenu pouzdanosti naučne literature, kao što je otkrivanje pristrasnosti publikacije ili p-hakovanje.[9][10]

Reference уреди

  1. ^ Wasserstein, Ronald L.; Lazar, Nicole A. (7. 3. 2016). „The ASA's Statement on p-Values: Context, Process, and Purpose”. The American Statistician. 70 (2): 129—133. doi:10.1080/00031305.2016.1154108. 
  2. ^ а б Bhattacharya, Bhaskar; Habtzghi, DeSale (2002). „Median of the p value under the alternative hypothesis”. The American Statistician. 56 (3): 202—6. doi:10.1198/000313002146. 
  3. ^ Wetzels, R.; Matzke, D.; Lee, M. D.; Rouder, J. N.; Iverson, G. J.; Wagenmakers, E. -J. (2011). „Statistical Evidence in Experimental Psychology: An Empirical Comparison Using 855 t Tests”. Perspectives on Psychological Science. 6 (3): 291—298. PMID 26168519. doi:10.1177/1745691611406923. 
  4. ^ Babbie, E. (2007). The practice of social research 11th ed. Thomson Wadsworth: Belmont, California.
  5. ^ Ioannidis, John P. A.; Ware, Jennifer J.; Wagenmakers, Eric-Jan; Simonsohn, Uri; Chambers, Christopher D.; Button, Katherine S.; Bishop, Dorothy V. M.; Nosek, Brian A.; Munafò, Marcus R. (januar 2017). „A manifesto for reproducible science”. Nature Human Behaviour (на језику: енглески). стр. 0021. doi:10.1038/s41562-016-0021. Приступљено 9. 5. 2019. 
  6. ^ ASA House Style
  7. ^ Benjamin, Daniel J.; Berger, James O.; Johannesson, Magnus; et al. (1. 9. 2017). „Redefine statistical significance”. Nature Human Behaviour. 2 (1): 6—10. PMID 30980045. doi:10.1038/s41562-017-0189-z. eISSN 2397-3374. 
  8. ^ Hung HM, O'Neill RT, Bauer P, Köhne K (март 1997). „The behavior of the P-value when the alternative hypothesis is true”. Biometrics (Submitted manuscript). 53 (1): 11—22. JSTOR 2533093. PMID 9147587. doi:10.2307/2533093. 
  9. ^ а б Head ML, Holman L, Lanfear R, Kahn AT, Jennions MD (март 2015). „The extent and consequences of p-hacking in science”. PLOS Biology. 13 (3): e1002106. PMC 4359000 . PMID 25768323. doi:10.1371/journal.pbio.1002106. 
  10. ^ Simonsohn U, Nelson LD, Simmons JP (новембар 2014). „p-Curve and Effect Size: Correcting for Publication Bias Using Only Significant Results”. Perspectives on Psychological Science. 9 (6): 666—681. PMID 26186117. S2CID 39975518. doi:10.1177/1745691614553988. 

Literatura уреди

Spoljašnje veze уреди