Расподела вероватноће
У теорији вероватноће и статистици, расподела вероватноће је математичка функција која даје вероватноћу појаве различитих могућих исхода у експерименту.[1][2] У техничком смислу, дистрибуција вероватноће је опис рандомне појаве у погледу вероватноће догађаја.[3] На пример, ако би се случајна променљива X користила за означавање исхода бацања новчића („експеримент”), тада би расподела вероватноће од X добила вредност 0,5 за X = главе, и X = писмо (под претпоставком да је кованица поштена). Примери рандомних појава обухватају резултате експеримента или истраживања.
Расподела вероватноћа се наводи на бази исходишног простора узорка, који је скуп свих могућих исхода случајне појаве која се посматра. Простор узорка може бити скуп реалних бројева или скуп вектора, или може бити списак ненумеричких вредности; на пример, узорак простора бацања кованице био би {глава, писмо} .
Расподеле вероватноће углавном се деле у две класе. Дискретна расподела вероватноће (примењива на сценарије у којима је скуп могућих исхода дискретан, попут бацања кованице или коцке) може се кодирати дискретном листом вероватноћа исхода, познатом као функција вероватноће.[4] С друге стране, континуирана расподела вероватноће (примењива на сценарије у којима скуп могућих исхода може да поприми вредности у непрекидном распону (нпр. реални бројеви), попут температуре датог дана) типично се описује функцијама густине вероватноће (са вероватноћом да је сваки појединачни исход заправо 0). Нормална расподела је уобичајена непрекидна расподела вероватноће.[5][6][7]
Сложенији експерименти, попут оних који укључују стохастичке процесе дефинисанe у континуираном времену, могу захтевати употребу општијих мера вероватноће.
Расподела вероватноће чији је простор узорка једнодимензионалан (на пример реални бројеви, листа натписа, уређене ознаке или бинарне вредности) назива се униваријантном, док се расподела чији је простор узорка векторски простор димензије 2 или више назива мултиваријантном. Униваријантна расподела даје вероватноће да једна случајна променљива поприми различите алтернативне вредности; мултиваријантна дистрибуција (здружена дистрибуција вероватноће) даје вероватноће да случајни вектор - листа са две или више случајних променљивих - поприми различите комбинације вредности. Важне и уобичајене расподеле вероватноће укључују биномну расподелу, хипергеометријску расподелу и нормалну расподелу. Мултиваријантна нормална расподела је често присутна мултиваријантна расподела.
Увод
уредиДа би се дефинисале расподеле вероватноће за најједноставније случајеве, потребно је разликовати дискретне и континуиране случајне променљиве. У дискретном случају довољно је одредити функцију вероватноће која додељује вероватноћу сваком могућем исходу: на пример, приликом бацања коцке, свака од шест вредности 1 до 6 има вероватноћу 1/6. Вероватноћа догађаја се тада дефинише као збир вероватноћa исхода који задовољавају догађај; на пример, вероватноћа догађаја „бацање коцке даје парну вредност” је
У контрасту с тим, када случајна променљива поприма вредности из континуума онда типично сваки појединачни исход има нулту вероватноћу, и само догађаји који укључују бесконачно много исхода, као што су интервали, могу имати позитивну вероватноћу. На пример, вероватноћа да неки предмет тежи тачно 500 g је нула, јер вероватноћа мерења тачно 500 g тежи нули са повећањев тачности наших мерних инструмената. Ипак, у контроли квалитета може се захтевати да вероватноћа да пакет од 500 g садржи између 490 g и 510 g не буде мања од 98%, и тај захтев је мање осетљив на тачност мерних инструмената.
Континуирана расподела вероватноће може се описати на више начина. Функција густине вероватноће описује инфинитезималну вероватноћу било које дате вредности, и вероватноћа да се исход налази у датом интервалу може се израчунати интегрисањем функције густине вероватноће током тог интервала.[8] С друге стране, функција кумулативне расподеле описује вероватноћу да случајна променљива није већа од дате вредности; вероватноћа да се исход налази у датом интервалу може се израчунати узимајући разлику између вредности функције кумулативне дистрибуције на крајњим тачкама интервала. Кумулативна функција расподеле је антидериват функције густине вероватноће под условом да потоња функција постоји.
Дефиниција
уредиРасподела вероватноће је ненегативна функција ƒ дефинисана на скупу реалних бројева , таква да је вероватноћа да случајна променљива узме вредност из интервала [a, b] за свако a < b дата интегралом: Интеграл функције ƒ на целом скупу једнак је 1.
Општа дефиниција вероватноће
уредиРасподела вероватноће се може описати у различитим облицима, као што је функција вероватноће или функција кумулативне дистрибуције. Један од најопштијих описа, који се примењује за апсолутно континуиране и дискретне променљиве, је помоћу функције вероватноће чији улазни простор је σ-алгебра, која даје вероватноћу реалног броја као свој излаз, посебно број у .
Функција вероватноће може узети као аргумент подскупове самог простора узорка, као у примеру бацања новчића, где је функција дефинисана тако да је P(глава) = 0.5 и P(реп) = 0.5. Међутим, због широке употребе рандомних променљивих, које трансформишу простор узорка у скуп бројева (нпр. , ), то је више уобичајено за проучавање дистрибуција вероватноће чији су аргументи подскупови ових посебних врста скупова (скупова бројева),[11] и све дистрибуције вероватноће о којима се говори у овом чланку су овог типа. Уобичајено је да се означава као вероватноћа да одређена вредност променљиве припада одређеном догађају .[12][13]
Горња функција вероватноће карактерише дистрибуцију вероватноће само ако задовољава све Колмогоровљеве аксиоме, то јест:
- , тако да је вероватноћа ненегативна
- , тако да ниједна вероватноћа не прелази
- за било коју дисјунктурну породицу скупова
Концепт функције вероватноће постаје ригорознији тако што се дефинише као елемент простора вероватноће , где је је скуп могућих исхода, је скуп свих подскупова чија се вероватноћа може измерити, а је функција вероватноће, или мера вероватноће, која додељује вероватноћу сваком од ових мерљивих подскупова .[14]
Види још
уредиРеференце
уреди- ^ Everitt, Brian (2006). The Cambridge dictionary of statistics (3rd изд.). Cambridge, UK: Cambridge University Press. ISBN 978-0-511-24688-3. OCLC 161828328.
- ^ Ash, Robert B. (2008). Basic probability theory (Dover изд.). Mineola, N.Y.: Dover Publications. стр. 66—69. ISBN 978-0-486-46628-6. OCLC 190785258.
- ^ Evans, Michael; Rosenthal, Jeffrey S. (2010). Probability and statistics: the science of uncertainty (2nd изд.). New York: W.H. Freeman and Co. стр. 38. ISBN 978-1-4292-2462-8. OCLC 473463742.
- ^ „AP Statistics Review - Density Curves and the Normal Distributions”. Архивирано из оригинала 02. 04. 2015. г. Приступљено 16. 3. 2015.
- ^ „AP Statistics Review - Density Curves and the Normal Distributions”. Архивирано из оригинала 2. 4. 2015. г. Приступљено 16. 3. 2015.
- ^ Grinstead, Charles M.; Snell, J. Laurie (2009). „Conditional Probability - Discrete Conditional” (PDF). Grinstead & Snell's Introduction to Probability. Orange Grove Texts. ISBN 978-1616100469. Архивирано (PDF) из оригинала 2003-04-25. г. Приступљено 2019-07-25.
- ^ „probability - Is a uniformly random number over the real line a valid distribution?”. Cross Validated. Приступљено 2021-10-06.
- ^ Grinstead, Charles M.; Snell, J. Laurie (2009). „Conditional Probability - Discrete Conditional” (PDF). Grinstead & Snell's Introduction to Probability. Orange Grove Texts. ISBN 161610046X. Архивирано из оригинала (PDF) 18. 07. 2019. г. Приступљено 25. 7. 2019.
- ^ Normal Distribution, Gale Encyclopedia of Psychology
- ^ „Normal Distribution”. www.mathsisfun.com. Приступљено 2020-08-15.
- ^ Walpole, R.E.; Myers, R.H.; Myers, S.L.; Ye, K. (1999). Probability and statistics for engineers. Prentice Hall.
- ^ Ross, Sheldon M. (2010). A first course in probability. Pearson.
- ^ DeGroot, Morris H.; Schervish, Mark J. (2002). Probability and Statistics. Addison-Wesley.
- ^ Billingsley, P. (1986). Probability and measure. Wiley. ISBN 9780471804789.
Литература
уреди- B. S. Everitt: The Cambridge Dictionary of Statistics, Cambridge University Press, Cambridge (3rd edition, 2006). ISBN 0-521-69027-7
- Bishop: Pattern Recognition and Machine Learning, Springer, ISBN 0-387-31073-8.
- den Dekker, A. J.; Sijbers, J. (2014). „Data distributions in magnetic resonance images: A review”. Physica Medica. 30 (7): 725—741. PMID 25059432. doi:10.1016/j.ejmp.2014.05.002.
- Pierre Simon de Laplace (1812). Analytical Theory of Probability.
- Andrei Nikolajevich Kolmogorov (1950). Foundations of the Theory of Probability.
- Patrick Billingsley (1979). Probability and Measure. New York, Toronto, London: John Wiley and Sons. ISBN 0-471-00710-2.
- David Stirzaker (2003). Elementary Probability. ISBN 0-521-42028-8.
- Olav Kallenberg; Foundations of Modern Probability, 2nd ed. Springer Series in Statistics. (2002). 650 pp. ISBN 0-387-95313-2
- Henk Tijms (2004). Understanding Probability. Cambridge Univ. Press.
- A lively introduction to probability theory for the beginner.
- Olav Kallenberg; Probabilistic Symmetries and Invariance Principles. Springer -Verlag, New York (2005). 510 pp. ISBN 0-387-25115-4
- Durrett, Rick (2019). Probability: Theory and Examples, 5th edition. UK: Cambridge University Press. ISBN 9781108473682.
- Gut, Allan (2005). Probability: A Graduate Course. Springer-Verlag. ISBN 0-387-22833-0.
- Billingsley, Patrick (1979). Probability and Measure. New York, Toronto, London: John Wiley and Sons. ISBN 0-471-00710-2.
- Casella, George; Berger, Roger L. (2002). Statistical Inference (Second изд.). Thomson Learning. стр. 34—37. ISBN 0-534-24312-6.
- Stirzaker, David (2003). Elementary Probability . ISBN 0-521-42028-8.
Спољашње везе
уреди- Hazewinkel Michiel, ур. (2001). „Probability distribution”. Encyclopaedia of Mathematics. Springer. ISBN 978-1556080104.
- Field Guide to Continuous Probability Distributions, Gavin E. Crooks.