Лемке-Хаусон алгоритам

Лемке-Хаусон алгоритам [1] је алгоритам за рачунање Нешовог еквилибријума двоматричне игре. Тврди се да је ово "најбољи познати комбинаторни алгоритам за проналажење Нешовог еквилибријума". [2]


Алгоритам уреди

Улаз алгоритма је игра два играча, Г. Г је представљена матрицама игара А и Б, димензија м × н, које садрже добити играча 1 и 2 респективно, који имају м и н чистих стратегија респективно. Од сада па надаље претпостављамо да су све добити позитивне (јер се скалирањем свака игра може трансформисати у стратешки еквивалентну игру са позитивним добитима).


Г има два одговарајућа политопа (звани политопи најбољег одзива) П1 и П2, у м димензија и н димензија респективно, дефинисана на следећи начин:

П1 је из Рм; нека {x1,...,xм} представља координате. П1 је дефинисано са м неједнакости xи ≥ 0, за све и ∈ {1,...,м}, и додатних н неједнакости Б1,јx1+...+Бм,јxм ≤ 1, за све ј ∈ {1,...,н}.

П2 је из Рн; нека {xм+1,...,xм+н} представља координате. П2 је дефинисано са н неједнакости xм+и ≥ 0, за све и ∈ {1,...,н}, и додатних м неједнакости Аи,1xм+1+...+Аи,нxм+н ≤ 1, за све и ∈ {1,...,м}.

П1 представља скуп ненормализованих расподела вероватноће за м чистих стратегија играча 1, тако да је очекивана добит играча 2 највише 1. Првих м услова ограничава вероватноће на ненегативне вредности, а других н услова ограничава очекивану добит сваке од н чистих стратегија играча 2 на највише 1. П2 има слично значење, при чему су улоге играча обрнуте.

Свако теме П1 је повезано са скупом ознака из скупа {1,...,м + н} на следећи начин. За и ∈ {1, ..., м}, теме в добија ознаку и ако је xи = 0 у темену в. За ј ∈ {1, ..., н}, теме в добија ознаку м + ј ако је Б1,јx1 + ... + Бм,јxм = 1. Под претпоставком да је П1 недегенерисано, свако теме је везано за м пљосни П1 и има м ознака. Приметимо да извор, који је теме П1, има ознаке {1, ..., м}.

Свако теме П2 повезано са скупом ознака из скупа {1, ..., м + н} на следећи начин. За ј ∈ {1, ..., н}, Теме w добија ознаку м + ј ако је xм+ј = 0 у темену w. За и ∈ {1, ..., м}, теме w добија ознаку и ако је Аи,1xм+1 + ... + Аи,нxм+н = 1. Под претпоставком да је П2 недегенерисано, свако теме је везано за м пљосни П2 и има м ознака. Приметимо да извор, који је теме П2, има ознаке {м + 1, ..., м + н}.

Посматрајмо пар темена (в,w), в ∈ П1, wП2. Кажемо да је (в,w) потпуно означен ако скупови придружени в и w садрже све ознаке из {1, ..., м + н}. Приметимо да ако су в анд w извори Рм и Рн респективно, онда је (в,w) потпуно означен. Кажемо да је (в,w) скоро потпуно означен (у погледу недостајуће ознаке г) ако скупови придружени в и w садрже све ознаке из {1, ..., м + н} осим г. У том случају ће постојати дупликатна ознака која је придружена и в и w.

Пивот операција подразумева замену в у пару (в,w) неким другим теменом суседним в у П1, или алтернативно заменом w неким другим теменом суседним w у П2. Ефекат операције је (у случају да је в замењено) замена неке ознаке в неком другом ознаком. За замењену ознаку се каже да је одбачена. За било коју задату ознаку в, могуће је одбацити дату ознаку померањем на теме суседно в које не садржи хиперраван повезану са том ознаком.

Алгоритам полази од потпуно означеног пара (в,w) састављеног од пара извора. Произвољена ознака г се одбаци пивот операцијом, доводећи нас до скоро потпуно означеног пара (в′,w′). Било који скоро потпуно означени пар подлеже двема пивот операцијама које одговарају одбацивању једне или друге копије дупликатне ознаке и свака од ових операција може резултовати новим скоро потпуно означеним паром или комплетно означеним паром. Најзад, алгоритам проналази потпуно означени пар (в*,w*), који није извор. (в*,w*) одговара пару ненормализованих расподела вероватноће у којима свака стратегија и играча 1 доноси добит 1, или доноси добит мању од 1 и играна је са вероватноћом 0 од стране играча 1 (слично опажање важи и за играча 2). Нормализовањем ових вредности на расподеле вероватноће добијамо Нешов еквилибријум (чије добити за играче су инверзије нормализационих фактора).

Особине алгоритма уреди

Алгоритам може да пронађе највише н + м различитих Нешових еквилибријума. Избор првобитно одбачене ознаке одређује који ће еквилибријум на крају алгоритам да пронађе.

Лемке-Хаусон алгоритам је еквивалентан следећем приступу заснованом на хомотопији: Модификовати Г одабиром произвољне чисте стратегије г и дати играчу који поседује ту стратегију велику исплату Б да је одигра. У модификованој игри, стратегија г се игра са вероватноћом 1, а други играч одиграва свој најбољи одговор на стратегију г са вероватноћом 1. Разматрати континуум игара у којима се Б стално смањује до 0. Постоји путања Нешових еквилибријума која повезује јединствени еквилибријум модификоване игре са еквилибријумом Г. Чиста стратегија г одабрана да добије бонус Б одговара првобитно одбаченој ознаци. [3]

Иако је алгоритам ефикасан у пракси, у најгорем случају број пивот операција може експоненцијално зависити од броја чистих стратегија у игри. [4] Такође, показано је да је проблем проналажења решења помоћу Лемке-Хаусон алгоритма ПСПАЦЕ-комплетан. [5]

Референце уреди

  1. ^ C. Е. Лемке анд Ј. Т. Хоwсон (1964). „Еqуилибриум поинтс оф биматриx гамес”. СИАМ Јоурнал он Апплиед Матхематицс. 12 (2): 413—423. дои:10.1137/0112033. 
  2. ^ Нисан, Ноам; Роугхгарден, Тим; Тардос, Éва; Вазирани, Вијаy V. (2007). Алгоритхмиц Гаме Тхеорy (ПДФ). Цамбридге, УК: Цамбридге Университy Пресс. стр. 33. ИСБН 978-0-521-87282-9. Архивирано из оригинала (ПДФ) 11. 02. 2015. г. Приступљено 03. 06. 2015. 
  3. ^ П. Ј-Ј. Херингс анд Р. Пеетерс (2010). „Хомотопy метходс то цомпуте еqуилибриа ин гаме тхеорy”. Ецономиц Тхеорy. 42 (1): 119—156. дои:10.1007/с00199-009-0441-5. 
  4. ^ Р. Савани анд Б. вон Стенгел (2006). „Хард-то-Солве Биматриx Гамес”. Ецонометрица. 74 (2): 397—429. дои:10.1111/ј.1468-0262.2006.00667.x. 
  5. ^ П.W. Голдберг, C.Х. Пападимитриоу анд Р. Савани (2011). Тхе Цомплеxитy оф тхе Хомотопy Метход, Еqуилибриум Селецтион, анд Лемке–Хоwсон Солутионс. Проц. 52нд ФОЦС. стр. 67—76. дои:10.1109/ФОЦС.2011.26.