Линеарна регресија

У статистици, линеарна регресија се односи на сваки приступ моделовања релација између једног или више респонса (зависних променљивих) означеног са Y, и једне или више независних променљивих означених са X, на начин да такав модел линеарно зависи од непознатих параметара процењених из података.[1] Најчешће се линеарна регресија односи на модел у којем је условна средња вредност од Y, уз дату вредност X, афина функција од X. Случај са једном независном променљивом се назива једноставна линеарна регресија. Кад је обухваћено више од једне независне променљиве, процес се зове вишеструка линеарна регресија.[2] Овај се термин разликује од мултиваријантне линеарне регресије, где се вишеструке корелисане зависне променљиве предвиђају, уместо једне скаларне променљиве.[3]

Пример линеарне регресије с једном независном променљивом

Много ређе, линеарна регресија се може односити на модел у којем се медијан, или неки други квантил условне дистрибуције Y за дато X изражава као линеарна функција од X. Као и сви други облици регресионе анализе, линеарна регресија има фокус на дистрибуцији условне вероватноће од Y за дани X, а не на дистрибуцији условне вероватноће од Y и X, што је домен мултиваријантне анализе (енгл. multivariate analysis).[4][5][6]

Линерана регресија је била први тип регресионе анализе[7][8] која је детаљно проучавана и која се екстензивно користила у практичним применама.[9] Разлог за ово је да се модели који линерано зависе од својих непознатих параметара лакше моделују него модели са нелинеарном зависношћу од параметара. Такође, статистичка својства резултирајућих естиматора се лакше одређују.

Линеарна регресија има много практичних примена. Већина апликација линеарне регресије спада у једну од следеће две широке категорије:

  • Ако је циљ предвиђање или прогноза, линеарна регресија се може користити за подешавање предитивног модела према разматраном скупу података вредности Y и X. Након развоја оваквог модела, ако је дата вредност за X без припадајуће вредности Y, модел се може користити за предвиђање вредности Y.
  • Ако је доступна варијабла Y и већи број варијабли X1, ..., Xp које могу бити повезане са Y, може се користити линерана регресиону анализа за квантификовање јачине релације између Y и Xј, за процену који је Xј уопште везан за Y, те да би идентификовало који подскупови од Xј садрже редундантне информације о Y, тако да кад је један од њих познат, остали више не дају корисне информације.

Линеарни регресиони модели се често подешавају уз помоћ методе најмањих квадрата,[10][11] иако се могу користити и други начини, као што је минимизовање „недостатка подешења” (енгл. lack of fit) у неким другим нормама, или минимизовањем пенализиране верзије функције губитака најмањих квадрата, као код Тихонове регуларизације.[12][13][14]

Насупрот томе, приступ методом најмањих квадрата се може искористити за подешавање нелинеарних модела. Према томе, појмови „најмањи квадрати” и „линеарни модел” јесу уско повезани, али нису синоними.

Увод

уреди
 
У линеарној регресији, за опажања (обележена црвено) се узима да су резултат рандомних девијација (обележених зелено) од темељног односа (означено плаво) између зависне променљиве (y) и независне променљиве (x).

Уз задати скуп података   од n статистичких јединица, модел линеарне регресије претпоставља да се релација између зависне варијабле   и п-вектора регресора   може приближно узети као линеарна. „Приближно” се овде односи на „сметње” εи — непосматрану случајну варијаблу која додаје шум у линеарну релацију између зависне варијабле и регресора. Стога, модел има облик

 

где је   унутарњи продукат између вектора   и  .

Често су ових n једначина сложене у векторски облик као

 

где је

 
 
 

Неке напомене везане за терминологију:

  •   је вектор измерених вредности  ;   се назива регресанд, зависна варијабла, ендогена варијабла, варијабла одговора или мерена варијабла. Ова варијабла се понекад назива и предвиђеном варијаблом, али то не треба мешати са предвиђеним вредностима, које се означавају са  . Одлука о томе која се варијабла у скупу података моделује као зависна варијабла, а која као независна може се темељити на претпоставци да је једна од варијабли последица или под утицајем друге варијабле. Алтернативно, може да постоји операциони разлог за моделовање једне променљиве као функције других, у ком случају нема потребе за претпостављањем узрочности.
  •   се може видети као матрица од редова-вектора   или n-димензионалних колонских-вектора  , који су познати као регресори, ексогене променљиве, променљиве објашњења, коваријати, инпутне променљиве, предикторске променљиве, или независне варијабле (ово не треба мешати са концептом независних рандомних променљивих). Матрица   се понекад назива матрицом дизајна.
    • Обично се константа уврштава као један од регресора. Посебно,   за  . Кореспондирајући елемент β се назива пресек. Многе процедуре статистичке инференције за линеарне моделе налажу постојање пресека, тако да се он обично укључује чак и ако теоретска разматрања сугеришу да његова вредност треба да буде једнака нули.
    • Понекад један од регресора може да буде нелинеарна функција другог регресора или податка, као што је то случају у полиномској регресији[15] и сегментној регресији.[16] Модел се сматра линеарним докле год је линеаран у погледу параметра вектора β.
    • Вредности xij могу да буду било измерене вредности случајних променљивих Xj или фиксне вредности изабране пре мерења зависних променљивих. Обе интерпретације могу да буду подесне у различитим случајевима, и генерално се користе исти поступци процене; међутим у тим ситуацијама се користе различити приступи асимптотској анализи.

Референце

уреди
  1. ^ Сеал, Хиларy L. (1967). „Тхе хисторицал девелопмент оф тхе Гаусс линеар модел”. Биометрика. 54 (1/2): 1—24. ЈСТОР 2333849. дои:10.1093/биомет/54.1-2.1. 
  2. ^ Фреедман, Давид А. (2009). Статистицал Моделс: Тхеорy анд Працтице. Цамбридге Университy Пресс. стр. 26. „А симпле регрессион еqуатион хас он тхе ригхт ханд сиде ан интерцепт анд ан еxпланаторy вариабле wитх а слопе цоеффициент. А мултипле регрессион еqуатион хас тwо ор море еxпланаторy вариаблес он тхе ригхт ханд сиде, еацх wитх итс оwн слопе цоеффициент 
  3. ^ Ренцхер, Алвин C.; Цхристенсен, Wиллиам Ф. (2012), „Цхаптер 10, Мултивариате регрессион – Сецтион 10.1, Интродуцтион”, Метходс оф Мултивариате Аналyсис, Wилеy Сериес ин Пробабилитy анд Статистицс, 709 (3рд изд.), Јохн Wилеy & Сонс, стр. 19, ИСБН 9781118391679 
  4. ^ Мардиа, КВ; ЈТ Кент & ЈМ Биббy (1979). Мултивариате Аналyсис. Ацадемиц Пресс,. ИСБН 978-0-12-471252-2. 
  5. ^ Феинстеин, А. Р. (1996) Мултивариабле Аналyсис. Неw Хавен, ЦТ: Yале Университy Пресс.
  6. ^ Јохнсон, Рицхард А.; Wицхерн, Деан W. (2007). Апплиед Мултивариате Статистицал Аналyсис (Сиxтх изд.). Прентице Халл. ИСБН 978-0-13-187715-3. 
  7. ^ Бисхоп, Цхристопхер M. (2006). Паттерн Рецогнитион анд Мацхине Леарнинг. Спрингер. стр. 3. 
  8. ^ Wаегеман, Wиллем; Де Баетс, Бернард; Боулларт, Луц (2008). „РОЦ аналyсис ин ординал регрессион леарнинг”. Паттерн Рецогнитион Леттерс. 29: 1—9. дои:10.1016/ј.патрец.2007.07.019. 
  9. ^ Yан, Xин (2009), Линеар Регрессион Аналyсис: Тхеорy анд Цомпутинг, Wорлд Сциентифиц, стр. 1—2, ИСБН 9789812834119, „Регрессион аналyсис ... ис пробаблy оне оф тхе олдест топицс ин матхематицал статистицс датинг бацк то абоут тwо хундред yеарс аго. Тхе еарлиест форм оф тхе линеар регрессион wас тхе леаст сqуарес метход, wхицх wас публисхед бy Легендре ин 1805, анд бy Гаусс ин 1809 ... Легендре анд Гаусс ботх апплиед тхе метход то тхе проблем оф детермининг, фром астрономицал обсерватионс, тхе орбитс оф бодиес абоут тхе сун. 
  10. ^ Бретсцхер, Отто (1995). Линеар Алгебра Wитх Апплицатионс (3рд изд.). Уппер Саддле Ривер, Њ: Прентице Халл. 
  11. ^ Стиглер, Степхен M. (1981). „Гаусс анд тхе Инвентион оф Леаст Сqуарес”. Анн. Стат. 9 (3): 465—474. дои:10.1214/аос/1176345451. 
  12. ^ Хоерл, Артхур Е. (1962). „Апплицатион оф Ридге Аналyсис то Регрессион Проблемс”. Цхемицал Енгинееринг Прогресс. 58 (3): 54—59. 
  13. ^ Фостер, M. (1961). „Ан Апплицатион оф тхе Wиенер-Колмогоров Смоотхинг Тхеорy то Матриx Инверсион”. Јоурнал оф тхе Социетy фор Индустриал анд Апплиед Матхематицс. 9 (3): 387. дои:10.1137/0109031. 
  14. ^ Хоерл, Р. W.; Кеннард (1970). „Ридге регрессион: Биасед естиматион фор нонортхогонал проблемс”. Тецхнометрицс. 12 (1): 55—67. ЈСТОР 1271436. дои:10.2307/1267351. 
  15. ^ Yин-Wен Цханг; Цхо-Јуи Хсиех; Каи-Wеи Цханг; Мицхаел Ринггаард; Цхих-Јен Лин (2010). „Траининг анд тестинг лоw-дегрее полyномиал дата маппингс виа линеар СВМ”. Јоурнал оф Мацхине Леарнинг Ресеарцх. 11: 1471—1490. 
  16. ^ Статистицал сигнифицанце оф сегментед линеар регрессион wитх бреак-поинт усинг варианце аналyсис анд Ф-тестс. Доwнлоад фром [1] ундер нр. 13, ор дирецтлy ас ПДФ : [2]

Литература

уреди
  • Цохен, Ј., Цохен П., Wест, С.Г., & Аикен, L.С. (2003). Апплиед мултипле регрессион/цоррелатион аналyсис фор тхе бехавиорал сциенцес. (2нд ед.) Хиллсдале, Њ: Лаwренце Ерлбаум Ассоциатес
  • Цхарлес Дарwин. Тхе Вариатион оф Анималс анд Плантс ундер Доместицатион. (1868) (Цхаптер XIII десцрибес wхат wас кноwн абоут реверсион ин Галтон'с тиме. Дарwин усес тхе терм "реверсион".)
  • Драпер, Н.Р.; Смитх, Х. (1998). Апплиед Регрессион Аналyсис (3рд изд.). Јохн Wилеy. ИСБН 978-0-471-17082-2. 
  • Францис Галтон. "Регрессион Тоwардс Медиоцритy ин Хередитарy Статуре," Јоурнал оф тхе Антхропологицал Институте, 15:246-263 (1886). (Фацсимиле ат: [3])
  • Роберт С. Пиндyцк анд Даниел L. Рубинфелд (1998, 4х ед.). Ецонометриц Моделс анд Ецономиц Форецастс, цх. 1 (Интро, инцл. аппендицес он Σ операторс & дериватион оф параметер ест.) & Аппендиx 4.3 (мулт. регрессион ин матриx форм).
  • Педхазур, Елазар Ј (1982). „Мултипле регрессион ин бехавиорал ресеарцх: Еxпланатион анд предицтион” (2нд изд.). Неw Yорк: Холт, Ринехарт анд Wинстон. ИСБН 978-0-03-041760-3. 
  • Матхиеу Роуауд, 2013: Пробабилитy, Статистицс анд Естиматион Цхаптер 2: Линеар Регрессион, Линеар Регрессион wитх Еррор Барс анд Нонлинеар Регрессион.
  • Натионал Пхyсицал Лабораторy (1961). „Цхаптер 1: Линеар Еqуатионс анд Матрицес: Дирецт Метходс”. Модерн Цомпутинг Метходс. Нотес он Апплиед Сциенце. 16 (2нд изд.). Хер Мајестy'с Статионерy Оффице. 

Спољашње везе

уреди