У статистичком тестирању хипотезе, p-вредност (енгл. probability value) или вредност вероватноће, за дати статистички модел вероватноћа је да ће, када је нулта хипотеза тачна, статистички параметар (као што је апсолутна вредност просечне разлике између две упоређене групе) бити већи или једнак стварно уоченом резултатима.[1] Употреба p-вредности у тестирању статистичких хипотеза је уобичајена у многим областима истраживања[2] као што су физика, економија, финансије, политичке науке, психологија,[3] биологија, кривично право, криминологија и социологија.[4] Злоупотреба p-вредности је контроверзна тема у метанауци.[5]

Закошавање слова, употреба великих слова и дељења речи варирају. На пример, АМА стил користи „П вредност”, АПА стил користи „п вредност”, а Америчко статистичко удружење користи „п-вредност”.[6]

Дефиниција и интерпретација уреди

Дефиниција уреди

Вероватноћа под нултом хипотезом добијања статистике теста са реалном вредношћу која је најмање екстремна као и добијена уреди

Узмимо у обзир посматрану статистику теста   из непознате дистрибуције  . Тада је п-вредност   оно што би била претходна вероватноћа да се посматра статистичка вредност теста барем тако „екстремна” као   ако је нулта хипотеза   била истинита. То је:

  •   за једнострану дистрибуцију тест статистике на десни реп,
  •   за једнострану дистрибуцију тест статистике са леве стране,
  •   за двострану дистрибуцију тест-статистике. Ако је расподела   симетрична око нуле, онда је  

Тумачења уреди

п-вредност као статистика за извођење тестова значајности уреди

У тесту значаја, нулта хипотеза   се одбацује ако је п-вредност мања или једнака унапред дефинисаној граничној вредности  , која се назива алфа ниво или ниво значајности.   није изведено из података, већ га поставља истраживач пре испитивања података.   се обично поставља на 0,05, мада се понекад користе нижи нивои за алфа. У 2018. години, група статистичара на челу са Данијелом Бенџамином предложила је усвајање вредности од 0,005 као стандардне вредности за статистичку значајност широм света.[7]

Дистрибуција уреди

Када је нулта хипотеза тачна, ако има облик  , а основна случајна променљива је континуирана, онда је расподела вероватноће п-вредности униформна на интервалу [0,1]. Насупрот томе, ако је алтернативна хипотеза тачна, дистрибуција зависи од величине узорка и праве вредности параметра који се проучава.[2][8]

Дистрибуција п-вредности за групу студија се понекад назива п-крива.[9] п-крива се може користити за процену поузданости научне литературе, као што је откривање пристрасности публикације или п-хаковање.[9][10]

Референце уреди

  1. ^ Wассерстеин, Роналд L.; Лазар, Ницоле А. (7. 3. 2016). „Тхе АСА'с Статемент он п-Валуес: Цонтеxт, Процесс, анд Пурпосе”. Тхе Америцан Статистициан. 70 (2): 129—133. дои:10.1080/00031305.2016.1154108. 
  2. ^ а б Бхаттацхарyа, Бхаскар; Хабтзгхи, ДеСале (2002). „Медиан оф тхе п валуе ундер тхе алтернативе хyпотхесис”. Тхе Америцан Статистициан. 56 (3): 202—6. дои:10.1198/000313002146. 
  3. ^ Wетзелс, Р.; Матзке, D.; Лее, M. D.; Роудер, Ј. Н.; Иверсон, Г. Ј.; Wагенмакерс, Е. -Ј. (2011). „Статистицал Евиденце ин Еxпериментал Псyцхологy: Ан Емпирицал Цомпарисон Усинг 855 т Тестс”. Перспецтивес он Псyцхологицал Сциенце. 6 (3): 291—298. ПМИД 26168519. дои:10.1177/1745691611406923. 
  4. ^ Баббие, Е. (2007). Тхе працтице оф социал ресеарцх 11тх ед. Тхомсон Wадсwортх: Белмонт, Цалифорниа.
  5. ^ Иоаннидис, Јохн П. А.; Wаре, Јеннифер Ј.; Wагенмакерс, Ериц-Јан; Симонсохн, Ури; Цхамберс, Цхристопхер D.; Буттон, Катхерине С.; Бисхоп, Доротхy V. M.; Носек, Бриан А.; Мунафò, Марцус Р. (јануар 2017). „А манифесто фор репродуцибле сциенце”. Натуре Хуман Бехавиоур (на језику: енглески). стр. 0021. дои:10.1038/с41562-016-0021. Приступљено 9. 5. 2019. 
  6. ^ АСА Хоусе Стyле
  7. ^ Бењамин, Даниел Ј.; Бергер, Јамес О.; Јоханнессон, Магнус; et al. (1. 9. 2017). „Redefine statistical significance”. Nature Human Behaviour. 2 (1): 6—10. PMID 30980045. doi:10.1038/s41562-017-0189-z. eISSN 2397-3374. 
  8. ^ Hung HM, O'Neill RT, Bauer P, Köhne K (март 1997). „The behavior of the P-value when the alternative hypothesis is true”. Biometrics (Submitted manuscript). 53 (1): 11—22. JSTOR 2533093. PMID 9147587. doi:10.2307/2533093. 
  9. ^ а б Head ML, Holman L, Lanfear R, Kahn AT, Jennions MD (март 2015). „The extent and consequences of p-hacking in science”. PLOS Biology. 13 (3): e1002106. PMC 4359000 . PMID 25768323. doi:10.1371/journal.pbio.1002106. 
  10. ^ Simonsohn U, Nelson LD, Simmons JP (новембар 2014). „p-Curve and Effect Size: Correcting for Publication Bias Using Only Significant Results”. Perspectives on Psychological Science. 9 (6): 666—681. PMID 26186117. S2CID 39975518. doi:10.1177/1745691614553988. 

Literatura уреди

Спољашње везе уреди