Лекции.Орг


Поиск:




Категории:

Астрономия
Биология
География
Другие языки
Интернет
Информатика
История
Культура
Литература
Логика
Математика
Медицина
Механика
Охрана труда
Педагогика
Политика
Право
Психология
Религия
Риторика
Социология
Спорт
Строительство
Технология
Транспорт
Физика
Философия
Финансы
Химия
Экология
Экономика
Электроника

 

 

 

 


Решение игр в смешанных стратегиях




Если парная игра не имеет седловой точки, то она не имеет и решения, то есть, делая личные ходы (или, говоря иначе, в чистых стратегиях), игрок A гарантирует себе выигрыш, равный нижней цене игры, которая, вообще говоря, меньше верхней цены игры.

Если же игрок A будет чередовать свои стратегии случайным образом или, говоря иначе, придерживаться смешанной стратегии, то он получит оптимальную стратегию, которая в некоторых случаях будет гарантировать ему бόльший выигрыш.

Определение. Пусть игрок A имеет m стратегий, а игрок B – n стратегий. Смешанной стратегией игрока A называется набор вероятностей SA = (p1, p2, …, pm), где p1 + p2 +… + pm = 1, с которыми он чередует свои стратегии.

Аналогично определяется смешанная стратегия игрока B как набор SB = (q1, q2, …, qm), где q1 + q2 +… + qn = 1.

Имеет место следующая теорема.

Теорема (основная теорема теории игр). Любая m ´ n игра имеет решение в смешанных стратегиях и её решение может получено методами линейного программирования.

Доказательство. Пусть m ´ n игра имеет матрицу

требуется найти решение игры, то есть две оптимальные смешанные стратегии игроков SA = (p1, p2, …, pm) и SB = (q1, q2, …, qm), где p1 + p2 +… + pm = 1 и q1 + q2 +… + qn = 1.

Во-первых, можно считать, что цена игры n (пока неизвестная) больше нуля. Действительно, если n £ 0, то это означает, что некоторые элементы матрицы игры не положительные. Тогда найдём число M > 0, которое прибавим ко всем элементам матрицы игры и получим новую матрицу с положительными элементами. Это сложение сделает новую цену игры n + M положительной, но не изменит решения игры.

Во-вторых, предположим, что игрок A применяет свою оптимальную смешанную стратегию , а игрок B свою чистую стратегию Bj. В этом случае средний выигрыш игрока A будет равен

Стратегия является оптимальной, то есть при любой стратегии игрока B средний выигрыш игрока A будет больше или равен цены игры n, таким образом, получаем систему ограничений

Разделим обе части всех неравенств на положительное число n и обозначим

тогда система ограничений примет вид

Далее, так как p1 + p2 +… + pm = 1, то

Игрок A стремится максимизировать свой средний выигрыш n, то есть минимизировать отношение

Таким образом, получаем задачу линейного программирования:

Заметим, что эта задача имеет решение, найдя которое найдём новую цену игры , вычтя из которой число M, получим искомую цену игры.

Аналогичные рассуждения дают оптимальную стратегию игрока B:

обозначим

тогда оптимальная стратегия игрока B есть решение следующей задачи линейного программирования:

причём

Применим основную теорему теории игр для отыскания оптимальных стратегий игроков в игре "поиск".

1. Матрица игры "поиск" содержит отрицательные элементы, поэтому, прибавляя к её элементам число M= 1, получим

2. Для нахождения оптимальной стратегии игрока A решаем следующую задачу линейного программирования:

Так как последняя система ограничений эквивалентна системе

то минимум функции равен 1 и достигается при

Так как то n = 1. Вычитая из n число M = 1, получим, что цена игры равна 0 = 1 – 1, а оптимальная стратегия

Итак, чередуя свои обе стратегии с вероятностями , игрок A гарантирует себе средний выигрыш, равный 0, что больше нижней цены игры -1 при чистых стратегиях.

Аналогичные рассуждения приводят к тому, что игрок B, чередуя свои стратегии с вероятностями , получает средний выигрыш, равный 0.

6. ОТЧЕТ ДОЛЖЕН СОДЕРЖАТЬ:

6.1. Номер практической работы, ее название, номер выполняемого варианта.

6.2. Номер задания.

6.3. Условие решаемой задачи.

6.4. Математическая модель задачи.

6.5. Решение задачи теории игр.

7. КОНТРОЛЬНЫЕ ВОПРОСЫ:

7.1. Стратегия. Оптимальная стратегия.

7.2. Платежная матрица игры.

7.3. Нижняя и верхняя цена игры. Седловая точка.

7.4. Принцип минимакса.

7.5. Смешанные стратегии игроков.


ПРАКТИЧЕСКОЕ ЗАНЯТИЕ №8





Поделиться с друзьями:


Дата добавления: 2016-10-27; Мы поможем в написании ваших работ!; просмотров: 404 | Нарушение авторских прав


Поиск на сайте:

Лучшие изречения:

Есть только один способ избежать критики: ничего не делайте, ничего не говорите и будьте никем. © Аристотель
==> читать все изречения...

2217 - | 2173 -


© 2015-2024 lektsii.org - Контакты - Последнее добавление

Ген: 0.011 с.