Маргина грешке

Маргина грешке је статистичко изражавање количине случајне грешке узорковања у прегледима резултата.^[1]^[2] Што је већа грешка, то се може имати мање поверења да су резултати анкете блиски „истинитим” вредностима; то јест, вредностима за целу популацију. Маргина грешке је позитивна кад год се популација непотпуно узоркује, а мера исхода има позитивну варијансу (то јест, она варира).

Горњи део овог графика приказује густине вероватноће из којих се види релативна вероватноћа да је „истински” проценат у датом подручју с обзиром на изабрани проценат од 50%. Доњи део приказује интервале поузданости од 95% (хоризонтални линијски сегменти), кореспондирајуће маргине грешке (с леве стране) и величине узорка (с десне стране). Другим речима, за сваку величину узорка, постоји 95% сигурности да је „истински” проценат у региону назначеном кореспондирајућим сегментом. Што је узорак већи, то је мања маргина грешке.

Израз „маргина грешке” често се користи изван контекста анкета, како би означила грешка мерења у извештавању о измереним количинама.^[3]

Објашњење уреди

Маргина грешке се обично дефинише као „радијус” (или половина ширине) интервала поузданости за одређену статистику истраживања. Један пример је проценат људи који преферирају производ А у односу на производ Б. Када се за истраживање утврди појединачна, глобална маргина грешке, она се односи на максималну маргину грешке свих пријављених процената користећи пуни узорак анкете. Ако је статистика проценат, та максимална грешка може се израчунати као радијус интервала поузданости за дати проценат од 50%.

Маргина грешке се описује као „апсолутни” квантитет, једнак радијусу интервала поузданости датог статистика. На пример, ако је права вредност 50 процентних поена, а статистика има радијус интервала поузданости од пет процентних поена, тада се каже да је маргина грешке пет процената. Као још један пример, ако је права вредност 50 људи, а статистика има радијус интервала поузданости од пет људи, тада се може рећи да је маргина грешке пет људи.

У неким случајевима, маргина грешке се не изражава као „апсолутни” квантитет, већ се изражава као „релативна” количина. На пример, претпоставимо да је права вредност 50 људи, а статистика има радијус интервала поузданости од пет људи. Ако се користи „апсолутна” дефиниција, маргина грешка би била пет људи. Ако се користи „релативна” дефиниција, тада се апсолутна грешка изражава као проценат праве вредности. Дакле, у овом случају апсолутна грешка је пет људи, али „проценат грешке” је 10% (јер је пет људи десет процената од 50 људи). Разлика се често изричито не прави, мада је обично видљива из контекста.

Попут интервала поузданости, маргина грешке се може дефинисати за било који жељени интервал поузданости, мада се обично бирају нивои од 90%, 95% или 99% (типично 95%). Овај ниво је поузданост да маргина грешка око датог процента укључује „истински” проценат. Стога, на пример постоји сигурност, да на нивоу 95%, од сваких 100 једноставних случајних узорака узетих из одређене популације, 95 њих садржати истински проценат или другу статистику под истрагом, унутар маргине грешке асоциране са њима. Заједно са нивоом поузданости, дизајн узорка за истраживање, и посебно величина узорка, одређују величину маргине грешке. Већа величина узорка даје мању грешку, ако је све остало непромењено.

Ако се користе тачни интервали поузданости, тада маргина грешка узима у обзир грешку узорковања и грешку невезану за узорковање. Ако се користи приближни интервал поузданости (на пример, претпостављајући да је дистрибуција нормална и потом на одговарајући начин моделујући интервал поузданости), тада маргина грешке може да обухвати само рандомну грешку узорковања. Она не представља друге потенцијалне изворе грешака или пристрасност, као што је нерепрезентативан дизајн узорка, лоше формулисана питања, људи који лажу или одбијају да одговоре, искључење људи које није могуће контактирати, или погрешна пребројавања и прорачуни.

Концепт уреди

Пример из америчке председничке кампање 2004. године се може користити за илустрацију концепата у овом чланку. Према истраживању Њузвика од 2. октобра 2004. године, 47% регистрованих гласача гласало би за Џона Керија/Џона Едвардса ако би се избори одржали тог дана, 45% би гласало за Џорџа V. Буша/Дика Чејнија, а 2% би гласало за Ралфа Надера/Петера Камеха. Величина узорка је била 1.013.^[4] Ако није другачије наведено, остатак овог чланка користи 95% ниво поверења.

Основни концепт уреди

Анкете у основи обухватају узимање узорка из одређене популације. У случају Њузвикове анкете, од интереса је популација које ће гласати. Пошто је непрактично анкетирати све који ће гласати, анкетари узимају мање узорке који би требало да буду репрезентативни, односно случајни узорак становништва.^[5] Могуће је да се анкетира узорак од 1.013 бирача који случајно гласају за Буша, мада је у стварности становништво равномерно подељено између Буша и Керија, али то је врло мало вероватно (p = 2⁻¹⁰¹³ ≈ 1,1 × 10⁻³⁰⁵) с обзиром да је узорак рандоман.

Теорија узорковања пружа методе за израчунавање вероватноће да се резултати анкете разликују од стварности за више од одређеног износа, једноставно због случајности;^[6]^[7]^[8]^[9]^[10] на пример, да анкета извештава 47% за Керија, мада је његова подршка заправо чак 50%, или стварно само 44%. Ова теорија и неке Бајесове претпоставке сугеришу да ће „истински” проценат вероватно бити прилично близу 47%. Што више људи буде узорковано, у то већој мери анкетари могу бити сигурни да је „истински” проценат близу уоченог. Маргина грешке је мера тога колико су резултати вероватни.

Међутим, маргина грешке обухвата једино случајну грешку узорковања, тако да је слепа за систематске грешке које се могу увести одсуством респонса^[11]^[12] или интеракцијама између анкете и меморије анкетираних, мотивације, комуникације и знања.^[13]

Прорачуни уз претпоставку случајног узорковања уреди

Овај одељак укратко разматра стандардну грешку процента, одговарајућег интервала поузданости и повезује ова два концепта са маргином грешке. Ради једноставности, ова израчунавања претпостављају да је анкета заснована на једноставном рандомном узорку из велике популације.

Стандардна грешка извештеног удела или процента p мери његову тачност, и процењује се стандардном дефијацијом тог процента. Она се може проценити полазећи од p и величине узорка, n, ако је n мало у односу на величину популације, користећи следећу формулу: ^[14]

{\text{Standardna greška}}\approx {\sqrt {\frac {p(1-p)}{n}}}

Када узорак није једноставан рандомни узорак из велике популације, стандардна грешка и интервал поузданости морају се проценити помоћу напреднијих прорачуна. Линеаризација и реузорковање су широко коришћене технике за добијање података из сложених дизајна узорака.

Траба имати на уму да нужно не постоји строга веза између правог интервала поузданости и праве стандардне грешке. Прави интервал поузданости од p процента је интервал [a, b] који садржи p процената дистрибуције и где (100 - p)/2 процената дистрибуције лежи испод a, и (100 - p)/2 процената дистрибуција лежи изнад b. Истинска стандардна грешка датог статистика је квадратни корен истинске варијансе узорковања тог статистика. Та два параметра не морају да буду директно повезана, мада генерално за велике дистрибуције које изгледају као нормалне криве, постоји директна веза.

У анкети Њузвика, Керијев ниво подршке има p = 0,47 и n = 1,013. Стандардна грешка (,016 или 1,6%) помаже у стицању осећаја тачности Керијевог процењеног процента (47%). Бајесова интерпретација стандардне грешке је да иако се не зна „истински” проценат, врло је вероватно да се он налази унутар две стандардне грешке процењеног процента (47%). Стандардна грешка се може користити за креирање интервала поузданости у коме би „прави” проценат требало да буде до одређеног нивоа поузданости.

Процењени проценат плус или минус његова маргина грешке представља интервал поузданости процента. Другим речима, маргина грешке је половина ширине интервала поузданости. Она се може израчунати као умножак стандардне грешке, са фактором који зависи од жељеног нивоа поузданости; маргина од једне стандардне грешке даје 68% интервала поузданости, док процена плус или минус 1,96 стандардна грешка одговара 95% интервала поузданости, и 99% интервала поузданости покрива 2,58 стандардне грешке са обе стране процене.

Референце уреди

^ Бурнс, Н.; Грове, С. К. (2009). Тхе Працтице оф Нурсинг Ресеарцх: Аппраисал, Сyнтхесис, анд Генератион оф Евиденце (6тх изд.). Ст. Лоуис, МО: Саундерс Елсевиер. ИСБН 978-1-4557-0736-2.
^ Сцхеурен, Фритз (2005). „Wхат ис а Маргин оф Еррор?”. Wхат ис а Сурвеy? (ПДФ). Wасхингтон, D.C.: Америцан Статистицал Ассоциатион. Архивирано из оригинала (ПДФ) 12. 03. 2013. г. Приступљено 8. 1. 2008.
^ Таyлор, Јохн Роберт (1999). Ан Интродуцтион то Еррор Аналyсис: Тхе Студy оф Унцертаинтиес ин Пхyсицал Меасурементс. Университy Сциенце Боокс. стр. 94, §4.1. ИСБН 0-935702-75-X.
^ „НЕWСWЕЕК ПОЛЛ: Фирст Пресидентиал Дебате” (Саопштење). Неwсwеек. 2. 10. 2004. Приступљено 31. 5. 2006.
^ Wоннацотт анд Wоннацотт (1990), пп. 4–8.
^ Ланце, П.; Хаттори, А. (2016). Самплинг анд Евалуатион. Wеб: МЕАСУРЕ Евалуатион. стр. 6—8; 62—64.
^ Гровес, Роберт M.; et al. (14. 7. 2009). Сурвеy метходологy. ИСБН 978-0470465462.
^ Лохр, Схарон L. (1999). Самплинг: Десигн анд аналyсис.
^ Сäрндал, Царл-Ерик; Сwенссон, Бенгт; Wретман, Јан. Модел Ассистед Сурвеy Самплинг.
^ Сцхеаффер, Рицхард L.; Менденхал, Wиллиам; Р. Лyман Отт (2006). Елементарy сурвеy самплинг.
^ „Респонсе Ратес – Ан Овервиеw.”. Америцан Ассоциатион фор Публиц Опинион Ресеарцх (ААПОР). 29. 9. 2008. Архивирано из оригинала 12. 07. 2019. г. Приступљено 14. 08. 2019.
^ Виссер, Пеннy С.; Кросницк, Јон А.; Марqуетте, Јессе; Цуртин, Мицхаел (1996). „Маил Сурвеyс фор Елецтион Форецастинг? Ан Евалуатион оф тхе Цоломбиа Диспатцх Полл”. Публиц Опинион Qуартерлy. 60 (2): 181—227. дои:10.1086/297748.
^ Судман, С.L. анд Брадбурн Н.M. (1982) Аскинг Qуестионс. Јоссеy-Басс: пп. 17-19
^ Сампле Сизес, Маргин оф Еррор, Qуантитативе Аналyсис Архивирано 2012-01-21 на сајту Wayback Machine

Литература уреди

Судман, Сеyмоур анд Брадбурн, Норман (1982). Аскинг Qуестионс: А Працтицал Гуиде то Qуестионнаире Десигн. Сан Францисцо: Јоссеy Басс. ISBN 0-87589-546-8.
Wоннацотт, Т. Х.; Wоннацотт, Р. Ј. (1990). Интродуцторy Статистицс (5тх изд.). Wилеy. ИСБН 0-471-61518-8.
Цхамберс, Р L, анд Скиннер, C Ј (едиторс) (2003), Аналyсис оф Сурвеy Дата, Wилеy, ISBN 0-471-89987-9
Деминг, W. Едwардс (1975) Он пробабилитy ас а басис фор ацтион, Тхе Америцан Статистициан, 29(4), пп. 146–152.
Гy, П (1992) Самплинг оф Хетерогенеоус анд Дyнамиц Материал Сyстемс: Тхеориес оф Хетерогенеитy, Самплинг анд Хомогенизинг
Корн, Е.L., анд Граубард, Б.I. (1999) Аналyсис оф Хеалтх Сурвеyс, Wилеy, ISBN 0-471-13773-1
Луцас, Самуел Р. (2014). „Беyонд тхе еxистенце прооф: Онтологицал цондитионс, епистемологицал имплицатионс, анд ин-дептх интервиеw ресеарцх”. Qуалитy & Qуантитy. 48: 387—408. С2ЦИД 254989198. дои:10.1007/с11135-012-9775-3. .
Стуарт, Алан (1962) Басиц Идеас оф Сциентифиц Самплинг, Хафнер Публисхинг Цомпанy, Неw Yорк
Смитх, Т. M. Ф. (1984). „Пресент Поситион анд Потентиал Девелопментс: Соме Персонал Виеwс: Сампле сурвеyс”. Јоурнал оф тхе Роyал Статистицал Социетy, Сериес А. 147 (Тхе 150тх Анниверсарy оф тхе Роyал Статистицал Социетy, нумбер 2): 208—221. ЈСТОР 2981677. дои:10.2307/2981677.
Смитх, Т. M. Ф. (1993). „Популатионс анд Селецтион: Лимитатионс оф Статистицс (Пресидентиал аддресс)”. Јоурнал оф тхе Роyал Статистицал Социетy, Сериес А. 156 (2): 144—166. ЈСТОР 2982726. дои:10.2307/2982726.
Смитх, Т. M. Ф. (2001). „Биометрика центенарy: Сампле сурвеyс”. Биометрика. 88 (1): 167—243. дои:10.1093/биомет/88.1.167.
Смитх, Т. M. Ф. (2001). „Биометрика центенарy: Сампле сурвеyс”. Ур.: D. M. Титтерингтон анд D. Р. Цоx. Биометрика: Оне Хундред Yеарс. Оxфорд Университy Пресс. стр. 165—194. ИСБН 978-0-19-850993-6.
Wхиттле, П. (мај 1954). „Оптимум превентативе самплинг”. Јоурнал оф тхе Оператионс Ресеарцх Социетy оф Америца. 2 (2): 197—203. ЈСТОР 166605. дои:10.1287/опре.2.2.197.

Спољашње везе уреди

Хазеwинкел Мицхиел, ур. (2001). „Еррорс, тхеорy оф”. Енцyцлопаедиа оф Матхематицс. Спрингер. ISBN 978-1556080104.
Weisstein, Eric W. „Margin of Error”. MathWorld.

[Burns_&_Grove,_2009-1] Бурнс, Н.; Грове, С. К. (2009). Тхе Працтице оф Нурсинг Ресеарцх: Аппраисал, Сyнтхесис, анд Генератион оф Евиденце (6тх изд.). Ст. Лоуис, МО: Саундерс Елсевиер. ИСБН 978-1-4557-0736-2.

[Scheuren-2] Сцхеурен, Фритз (2005). „Wхат ис а Маргин оф Еррор?”. Wхат ис а Сурвеy? (ПДФ). Wасхингтон, D.C.: Америцан Статистицал Ассоциатион. Архивирано из оригинала (ПДФ) 12. 03. 2013. г. Приступљено 8. 1. 2008.

[Taylor-3] Таyлор, Јохн Роберт (1999). Ан Интродуцтион то Еррор Аналyсис: Тхе Студy оф Унцертаинтиес ин Пхyсицал Меасурементс. Университy Сциенце Боокс. стр. 94, §4.1. ИСБН 0-935702-75-X.

[newsweekpoll-4] „НЕWСWЕЕК ПОЛЛ: Фирст Пресидентиал Дебате” (Саопштење). Неwсwеек. 2. 10. 2004. Приступљено 31. 5. 2006.

[5] Wоннацотт анд Wоннацотт (1990), пп. 4–8.

[6] Ланце, П.; Хаттори, А. (2016). Самплинг анд Евалуатион. Wеб: МЕАСУРЕ Евалуатион. стр. 6—8; 62—64.

[Robert_M._Groves,_et_al-7] Гровес, Роберт M.; et al. (14. 7. 2009). Сурвеy метходологy. ИСБН 978-0470465462.

[8] Лохр, Схарон L. (1999). Самплинг: Десигн анд аналyсис.

[9] Сäрндал, Царл-Ерик; Сwенссон, Бенгт; Wретман, Јан. Модел Ассистед Сурвеy Самплинг.

[10] Сцхеаффер, Рицхард L.; Менденхал, Wиллиам; Р. Лyман Отт (2006). Елементарy сурвеy самплинг.

[11] „Респонсе Ратес – Ан Овервиеw.”. Америцан Ассоциатион фор Публиц Опинион Ресеарцх (ААПОР). 29. 9. 2008. Архивирано из оригинала 12. 07. 2019. г. Приступљено 14. 08. 2019.

[12] Виссер, Пеннy С.; Кросницк, Јон А.; Марqуетте, Јессе; Цуртин, Мицхаел (1996). „Маил Сурвеyс фор Елецтион Форецастинг? Ан Евалуатион оф тхе Цоломбиа Диспатцх Полл”. Публиц Опинион Qуартерлy. 60 (2): 181—227. дои:10.1086/297748.

[13] Судман, С.L. анд Брадбурн Н.M. (1982) Аскинг Qуестионс. Јоссеy-Басс: пп. 17-19

[14] Сампле Сизес, Маргин оф Еррор, Qуантитативе Аналyсис Архивирано 2012-01-21 на сајту Wayback Machine

[1]

[2]

[3]

[4]

[5]

[6]

[7]

[8]

[9]

[10]

[11]

[12]

[13]

[14]