Ћекции.ќрг


ѕоиск:




 атегории:

јстрономи€
Ѕиологи€
√еографи€
ƒругие €зыки
»нтернет
»нформатика
»стори€
 ультура
Ћитература
Ћогика
ћатематика
ћедицина
ћеханика
ќхрана труда
ѕедагогика
ѕолитика
ѕраво
ѕсихологи€
–елиги€
–иторика
—оциологи€
—порт
—троительство
“ехнологи€
“ранспорт
‘изика
‘илософи€
‘инансы
’ими€
Ёкологи€
Ёкономика
Ёлектроника

 

 

 

 


√еометрический способ решени€ антагонистических игр




 

√еометрический способ решени€ игр с нулевой суммой примен€етс€ к играм, где хот€ бы у одного игрока только две стратегии. »ногда возможно упростить игры, примен€€ следующие принципы:

1. »грок ј стремитс€ увеличить свой выигрыш, поэтому он не будет использовать стратегии, которые заведомо дают ему меньшие суммы;

2. »грок ¬ стремитс€ уменьшить свой проигрыш, поэтому он не будет использовать стратегии, которые заведомо отнимают большие суммы.

 

–ассмотрим платежную матрицу

 

         
5 4 3 2 3
5 6 6    
2 3 3 2 4

 

”простим матрицу, вычеркива€ заведомо невыгодные стратегии игроков.

 

ѕутем упрощени€, ее можно свести к матрице (2 * 2)

 

¬J јJ ¬1 ¬2
A1    
A2    

 

р1 - веро€тность применени€ игроком ј стратегии A1;

р2 - веро€тность применени€ игроком ј стратегии A2.

“ак как р1+ р2=1, то р2=1- р1. “огда получим:

 

„истые стратегии игрока ¬ ќжидаемые выигрыши игрока ј
¬1 4 р1+3 р2= (4-3)р1+3=р1+3
¬2 2 р1+5 р2=(2-5)р1+5=-3р1+5

 

Ќа оси ќх разместим точки р1=0 и р1=1, через которые проведем пр€мые, перпендикул€рны оси ќх. ѕодставл€€ р1=0 и р1=1 в выражение р1+3, найдем значени€, которые отложим на соответствующих перпендикул€рных пр€мых. —оединив эти точки, получим пр€мую.

јналогично рассмотрим выражение -3р1+5.

 

ќптимальна€ стратеги€ первого игрока найдетс€ из равенства выражений

р1+3 и -3р1+5: р1= р2=0,5. SA = (0,5; 0; 0,5; 0), при этом цена игры равна 3,5.

ƒл€ второго игрока оптимальна€ стратеги€ ищетс€ аналогично.

≈сли же игра не сводитс€ путем упрощени€ к 2 x n или m x 2, то составл€етс€ математическа€ модель и задача решаетс€ симплекс-методом.

8.3 »гры с Ђприродойї.

ƒл€ того чтобы можно сделать вывод о том какую именно стратегию выбирать игроку, необходимо использовать критерии ¬альда, √урвица, —эвиджа, Ћапласа, Ѕайеса.

 

1.  ритерий ¬альда. –екомендуетс€ примен€ть максиминную стратегию. ќна достигаетс€ из услови€ max min αij и совпадает с нижней ценой игры.

i j

 ритерий €вл€етс€ пессимистическим, считаетс€, что природа будет действовать наихудшим дл€ человека образом, агрессивно, делать все, чтобы помешать нам достигнуть успеха.

 

–ассмотрим задачу.

≈жедневный спрос на булочки в продовольственном магазине может принимать следующие значени€

         
         

≈сли булочка не продана днем, то она м.б. реализована за 15 центов к концу дн€. —вежие булочки продаютс€ по 49 центов за штуку. «атраты магазина на одну булочку 25 центов.

»спользу€ игровой подход, определить, какое число булочек надо заказывать ежедневно.

 

 

—оставим платежную матрицу. —начала вычислим прибыль (49-25=24) и убыток (15-25=-10).

           
  100*24 100*24 100*24 100*24 100*24
  100*24-50*10 150*24 150*24 150*24 150*24
  100*24-100*10 150*24-50*10 200*24 200*24 200*24
  100*24-150*10 150*24-100*10 200*24-50*10 250*24 250*24
  100*24-200*10 150*24-150*10 200*24-100*10 250*24-50*10 300*24

 

ѕлатежна€ матрица примет вид

           
           
           
           
           
           

 

¬ычислим критерий ¬альда - максиминный. ќн отражает принцип гарантированного результата:

ќлицетвор€ет позицию крайнего пессимизма: надо ориентироватьс€ всегда на худшие услови€, зна€ наверн€ка, что хуже этого не будет. Ётот перестраховочный подход дл€ того, кто очень боитс€ проиграть.

ќптимальной считаетс€ стратеги€, при которой гарантируетс€ выигрыш в любом случае, не меньший, чем нижн€€ цена игры с природой:

 

Ќ = max min αij

i j

ѕодсчитать min по строкам и выбрать ту стратегию, при которой минимум строки максимален.

ј1  
ј2  
ј3  
ј4  
ј5  

 ритерий ¬альда рекомендует выбирать стратегию ј1.

 

2.  ритерий √урвица (оптимизма - пессимизма).  ритерий рекомендует при выборе решени€ не руководствоватьс€ ни крайним пессимизмом (всегда рассчитывай на худшее), ни крайним легкомысленным оптимизмом (авось крива€ выведет).  ритерий рекомендует стратегию, определ€емую по формуле

H = Max {γmin aij + (1- γ)max aij}

i j j

где γ - степень оптимизма - измен€етс€ в диапазоне [0, 1].

 ритерий придерживаетс€ некоторой промежуточной позиции, учитывающей возможность как наихудшего, так и наилучшего поведени€ природы. ѕри γ = 1 критерий превращаетс€ в критерий ¬альда, при γ = 0 - в критерий максимума. Ќа γ оказывает вли€ние степень ответственности лица, принимающего решение по выбору стратегии. „ем хуже последстви€ ошибочных решений, больше желани€ застраховатьс€, тем γ ближе к единице.

–ассмотрим платежную матрицу.

ѕараметр √урвица возьмем равным 0,6.

  min max γmin aij + (1- γ)max aij
ј1     2400*0.6+0.4*2400=2400
ј2     1900*0.6+3600*0.4=2580
ј3     1400*0.6+4800*0.4=2760
ј4     900*0.6+6000*0.4=2940
ј5     400*0.6+7200*0.4=3120

 

 ритерий √урвица рекомендует стратегию ј5.

 

3.  ритерий —эвиджа. —уть критери€ состоит в выборе такой стратегии, чтобы не допустить чрезмерно высоких потерь, к которым она может привести. Ќаходитс€ матрица рисков, элементы которой показывают, какой убыток понесет человек (фирма), если дл€ каждого состо€ни€ природы он не выберет наилучшей стратегии.

 

Ёлементы матрицы рисков находитс€ по формуле (rij):

rij = maxaij - aij

где maxaij - максимальный элемент в столбце исходной матрицы.

ќптимальна€ стратеги€ находитс€ из выражени€

H = Min {max(max aij - aij)}

 

—оставим матрицу риска, (max aij - aij).

 

¬ыберем максимальный элемент в столбце и вычитаем из него остальные элементы столбца, получим max(max aij - aij).

            ћax
ј1            
ј2            
ј3            
ј4            
ј5            

 

»з максимальных значений последнего столбца выбираем минимальную величину, получим Min {max(max aij - aij)}.

 ритерий —эвиджа рекомендует стратегию ј4.

 

4.  ритерий Ћапласа. Ётот критерий основываетс€ на принципе недостаточного обосновани€. ѕоскольку веро€тности состо€ни€ не известны, необходима€ информаци€ дл€ вывода, что эти веро€тности различны, отсутствует. ѕоэтому можно предположить, что они равны. ¬ыбор стратегии осуществл€етс€ по формуле

H = Max {1/nЈ∑ aij}

где 1/n веро€тность реализации одного из состо€ний р = 1/n.

ј1 (2400+2400+2400+2400+2400)/5=2400
ј2 (1900+3600+3600+3600+3600)/5=3260
ј3 (1400+3100+4800+4800+4800)/5=3780
ј4 (900+2600+4300+6000+6000)/5=3960
ј5 (400+2100+3800+5500+7200)/5=3800

 

 ритерий Ћапласа рекомендует нам стратегию ј4.

“аким образом, рассмотрев одну платежную матрицу, мы получили, что критерии Ћапласа и —эвиджа рекомендует стратегию ј4. “о есть необходимый заказ булочек составит 250 единиц ежедневно.

5.  ритерий Ѕайеса. ѕрин€тие решени€ в услови€х риска.

≈сли в рассмотренных выше критери€х, необходима€ информаци€ о веро€тност€х какого-либо состо€ни€ отсутствовала, то критерий Ѕайеса действует в услови€х не полной информации, т.е. в услови€х риска (имеетс€ информаци€ о веро€тност€х применени€ стратегий второй стороной). Ёти веро€тности называютс€ априорными веро€тност€ми.

¬ыбор стратегии осуществл€етс€ по формуле

H = Max {∑pi aij}

≈жедневный спрос на булочки в продовольственном магазине задаетс€ следующим распределением веро€тностей

         
         
0,2 0,25 0,3 0,15 0,1

 

ѕоставив значение aij и pi в формулу, получим:

 

ј1 2400*0,2+2400*0,25+2400*0,3+2400*0,15+2400*0,1=2400
ј2 1900*0,2+3600*0,25+3600*0,3+3600*0,15+3600*0,1=3260
ј3 1400*0,2+3100*0,25+4800*0,3+4800*0,15+4800*0,1=3695
ј4 900*0,2+2600*0,25+4300*0,3+6000*0,15+6000*0,1=3620
ј5 400*0,2+2100*0,25+3800*0,3+5500*0,15+7200*0,1=3290

 ритерий Ѕайеса рекомендует стратегию ј3

¬ услови€х полной неопределенности теори€ не дает однозначных принципов выбора того или иного критери€.

ќптимальные стратегии, выбранные по различным критери€м, различны.

“аким образом, окончательный вывод зависит от предпочтений человека, который принимает решение.

ѕ–»ћ≈– є1

 

Ќайти оптимальные стратегии 1-го игрока, исход€ из различных критериев, в игре с полной неопределенностью относительно второго игрока, заданной платежной матрицей:

 

а11 а12 а13 а14 5 10 18 25

а21 а22 а23 а24 8 7 8 23

ј = а31 а32 а33 а34 ; ј = 21 18 12 21

а41 а42 а43 а44 20 22 19 15

 

–ешение.

1. ћаксиминный критерий ¬альда. max min аij

i j

¬ычислим минимальные значени€ по строкам min аij, а далее из них выберем максимальное.

5 10 18 255

ј = 8 7 8 23 7

21 18 12 21 12

20 22 19 1515

 

“аким образом, получаем Ќ =max min аij = 15 при применении стратегии ј4. i j

ќтвет: оптимальной стратегией 1-го игрока ј €вл€етс€

стратеги€ ј4.

 ритерий √урвица.

ѕараметр √урвица возьмем равным γ =0,6: γ= min аij+(1-γ) max аij

 

5 10 18 255 25 5*0,6+0,4*25=13

ј = 8 7 8 23 7 23 7*0,6+0,4*23=13,4

21 18 12 21 12 18 12*0,6+0,4*18=14,4

20 22 19 1515 22 15*0,6+0,4*22= 17,8

 

ѕолучаем H =max[0.6 min аij+(1-0.6) max аij]=17.8

i j

ќтвет: оптимальной стратегией первого игрока €вл€етс€

стратеги€ ј4.

 





ѕоделитьс€ с друзь€ми:


ƒата добавлени€: 2015-11-05; ћы поможем в написании ваших работ!; просмотров: 528 | Ќарушение авторских прав


ѕоиск на сайте:

Ћучшие изречени€:

ѕобеда - это еще не все, все - это посто€нное желание побеждать. © ¬инс Ћомбарди
==> читать все изречени€...

1299 - | 1238 -


© 2015-2024 lektsii.org -  онтакты - ѕоследнее добавление

√ен: 0.053 с.