Паретова расподела

Паретова расподела је именована по италијанском грађевинском инжењеру, економисти, и социологу Вилфреду Парету. Она је расподела вероватноће степеног закона која се користи за описивање друштвених, научних, геофизичких, актуарских, и многих других типова уочљивих појава. Првобитно примењена на описивање расподеле богатства у друштву, она описује тренд да велики део богатства поседује мали део становништва. Паретова дистрибуција је колоквијално постала позната и назива се Паретов принцип, или „80-20 правило”, а понекад се назива и „Матејев принцип”. Ово правило постулира да, на пример, 80% богатства друштва држи 20% његовог становништва. Међутим, не треба поистовећивати Паретову дистрибуцију и Паретов принцип, јер дистрибуција даје овај резултат само за одређену вредност степена, (α = лог45 ≈ 1.16). Иако је варијабилно, емпиријским опажањима је установљено да 80-20 дистрибуција одговара широком распону случајева, укључујући природне појаве и људске активности.

Парето тип I
Функција густине вероватноће
Паретове функције густине вероватноче типа I за разне вредности α
Паретове функције густине вероватноче типа I за разне вредности са Кад дистрибуција прилази где је Диракова делта функција.
Функција кумулативне расподеле
Парето Тyпе I цумулативе дистрибутион фунцтионс фор вариоус α
Паретове функције густине вероватноче типа I за разне вредности са
Параметри скала (реално)
облик (реално)
Носитељ
ПДФ
ЦДФ
Просек
Медијана
Модус
Варијанса
Коеф. асиметрије
Куртоза
Ентропија
МГФ
ЦФ
Фишерова информација

Дефиниција уреди

Ако је X рандоман променљива са Паретовом дистрибуцијом (тип I),[1] онда је вероватноћа да је X веће од неког броја x, и.е. тхе функција преживљавања (такође звана функција репа), дата са

 

где је xм (неопходно позитивни) минимум могуће вредности од X, и α је позитивни параметер. Паретова расподела типа I је карактерисана параметром скалирања xм и параметром облика α, који је познат као индекс репа. Када се ова расподела користи за моделовање расподеле богатства, онда се параметер α назива Паретов индекс.

Својства уреди

Функција кумулативне дистрибуције уреди

По дефиницији, кумулативна функција расподеле Паретове рандомне променљиве са параметрима α и xm је

 

Функција густине вероватноће уреди

По диференцијацији следи да је функција густине вероватноће

 

Када се прикаже на линеарним осама, дистрибуција претпоставља познату криву у облику слова Ј која се асимптотски приближава свакој од ортогоналних оса. Сви сегменти криве су слични (подложни одговарајућим факторима скалирања). Када је прикаже на лог-лог графу, дистрибуција је представљена правом линијом.

Моменти и карактеристична функција уреди

 
 
(Ако је α ≤ 1, варијанса не постоји.)
 
 
 
 
где је Γ(аx) некомплетна гама функција.

Условне дистрибуције уреди

Дистрибуција условне вероватноће Парето-расподељене рандомне променљиве, датог догађаја који је већи или једнак од задатог броја   до  , је Паретова дистрибуција са истим Паретовим индексом   али са минимумом   уместо  .

Карактеризациона теорема уреди

Нека су   независне идентично распоређене рандомне променљиве чија је расподела вероватноће подржана на интервалу   за неко  . Нека су за свако  , две рандомне променљиве   и   независне. Онда је заједничка дистрибуција Паретова дистрибуција.

Геометријска средина уреди

Геометријска средина (G) је[2]

 

Хармонијска средина уреди

Хармонијска средина (H) је[2]

 

Примене уреди

Вилфредо Парето је изворно користио ову дистрибуцију како би описао расподелу богатства међу појединцима, јер се чинило да прилично добро показује начин на који већи део богатства било ког друштва поседује мањи проценат људи у том друштву. Такође је користио ову дистрибуцију да опише расподелу дохотка.[3] Та се идеја понекад изражава једноставније као Паретов принцип или „правило 80-20”, што говори да 20% становништва контролише 80% богатства.[4] Међутим, правило 80-20 одговара одређеној вредности α, и заправо, Паретови подаци о британским порезима на доходак у његовом раду Cours d'économie politique показују да је око 30% становништва имало око 70% прихода. Граф функције густине вероватноће (ПДФ) на почетку овог чланка показује да је „вероватноћа” или део популације која поседује малу количину богатства по особи прилично висока, а затим се стално смањује како богатство расте. (Паретова расподела није реалистична за богатство при доњем крају. Заправо нето вредност може чак да буде и негативна.) Ова дистрибуција није ограничена на описивање богатства или прихода, већ се сусреће у многим ситуацијама у којима је равнотежа пронађена у дистрибуцији „малог” на „велико”. Следећи примери се понекад сматрају приближно расподељеним по Паретовој дистрибуцији:

 
Кумулативна Паретова (Ломаксова) дистрибуција до максималних једнодневних падавина приказана користећи CumFreq
  • Величине људских насеља (неколико градова, много засеока/села)[5]
  • Расподела величина датотека у Интернет промету који користи ТЦП протокол (много мањих датотека, неколико већих)[5]
  • Стопе грешака тврдих дискова[6]
  • Кластери Бозе–Ајнштајновог кондензата у близини апсолутне нуле[7]
  • Вредности нафтних резериви у нафтним пољима (неколико великих поља, много малих поља)[5]
  • Расподела дужине послова задатих суперрачунарима (неколико великих, пуно малих)[8]
  • Стандардизоване цене повраћаја на индивидуалним деоницама[5]
  • Величине честица песка [5]
  • Величина метеорита
  • Озбиљност великих губитака од несреће за поједине делатности као што су општа одговорност, комерцијална возила и накнаде радника.[9][10]
  • Количина времена коју ће корисник на стиму провести играјући разне игре. (Неке игре се пуно играју, док се већина њих скоро никад не игра.)[11]
  • У хидрологији Паретова дистрибуција се користи за екстремне догађаје као што су годишње максималне једнодневне падавине и речни испусти.[12] Плава слика илуструје уклапање Паретове дистрибуције у рангиране годишње максимуме једнодневних падавина. Такође је приказан 90% појас поузданости базиран на биномној дистрибуцији. Подаци о падавинама су представљени помоћу Q–Q графика као дела анализе кумулативне фреквенције.

Референце уреди

  1. ^ Баррy C. Арнолд (1983). Парето Дистрибутионс. Интернатионал Цо-оперативе Публисхинг Хоусе. ИСБН 978-0-89974-012-6. 
  2. ^ а б Јохнсон НЛ, Котз С, Балакрисхнан Н (1994) Цонтинуоус унивариате дистрибутионс Вол 1. Wилеy Сериес ин Пробабилитy анд Статистицс.
  3. ^ Парето, Вилфредо, Цоурс д'Éцономие Политиqуе: Ноувелле éдитион пар Г.-Х. Боусqует ет Г. Бусино, Либраирие Дроз, Генева, 1964, пп. 299–345.
  4. ^ Фор а тwо-qуантиле популатион, wхере аппроxимателy 18% оф тхе популатион оwнс 82% оф тхе wеалтх, тхе Тхеил индеx такес тхе валуе 1.
  5. ^ а б в г д Реед, Wиллиам Ј.; et al. (2004). „Тхе Доубле Парето-Логнормал Дистрибутион – А Неw Параметриц Модел фор Сизе Дистрибутионс”. Цоммуницатионс ин Статистицс – Тхеорy анд Метходс. 33 (8): 1733—53. ЦитеСеерX 10.1.1.70.4555 . дои:10.1081/ста-120037438. 
  6. ^ Сцхроедер, Бианца; Дамоурас, Сотириос; Гилл, Пхиллипа (24. 2. 2010). „Ундерстандинг латент сецтор еррор анд хоw то протецт агаинст тхем” (ПДФ). 8тх Усениx Цонференце он Филе анд Стораге Тецхнологиес (ФАСТ 2010). Приступљено 10. 9. 2010. „Wе еxпериментед wитх 5 дифферент дистрибутионс (Геометриц,Wеибулл, Раyлеигх, Парето, анд Логнормал), тхат аре цоммонлy усед ин тхе цонтеxт оф сyстем релиабилитy, анд евалуатед тхеир фит тхроугх тхе тотал сqуаред дифференцес бетwеен тхе ацтуал анд хyпотхесизед фреqуенциес (χ2 статистиц). Wе фоунд цонсистентлy ацросс алл моделс тхат тхе геометриц дистрибутион ис а поор фит, wхиле тхе Парето дистрибутион провидес тхе бест фит. 
  7. ^ Yуји Ијири; Симон, Херберт А. (мај 1975). „Соме Дистрибутионс Ассоциатед wитх Босе–Еинстеин Статистицс”. Проц. Натл. Ацад. Сци. УСА. 72 (5): 1654—57. Бибцоде:1975ПНАС...72.1654И. ПМЦ 432601 . ПМИД 16578724. дои:10.1073/пнас.72.5.1654. 
  8. ^ Харцхол-Балтер, Мор; Доwнеy, Аллен (август 1997). „Еxплоитинг Процесс Лифетиме Дистрибутионс фор Дyнамиц Лоад Баланцинг” (ПДФ). АЦМ Трансацтионс он Цомпутер Сyстемс. 15 (3): 253—258. дои:10.1145/263326.263344. 
  9. ^ Клеибер анд Котз (2003): п. 94.
  10. ^ Сеал, Х. (1980). „Сурвивал пробабилитиес басед он Парето цлаим дистрибутионс”. АСТИН Буллетин. 11: 61—71. дои:10.1017/С0515036100006620. 
  11. ^ „Стеам инфо”. Архивирано из оригинала 05. 09. 2020. г. Приступљено 17. 08. 2019. 
  12. ^ ЦумФреq, софтwаре фор цумулативе фреqуенцy аналyсис анд пробабилитy дистрибутион фиттинг [1]

Литература уреди

  • Парето, Вилфредо (1895). „Ла легге делла доманда”. Гиорнале Дегли Ецономисти. 10: 59—68. 

Спољашње везе уреди