12. Как выбираются стратегии поведения по критериям Вальда, Сэвиджа, Гурвица (опишите процесс решения в среде Excel)?
1) Критерий Вальда
В соответствии с критерием Вальда в качестве оптимальной выбирается стратегия, гарантирующая выигрыш не меньший, чем "нижняя цена игры с природой". Правило выбора решения в соответствии с критерием Вальда можно интерпретировать следующим образом: матрица решений дополняется еще одним столбцом из наименьших результатов каждой строки. Выбрать надлежит тот вариант, в строке которого стоит наибольшее значение этого столбца. Выбранное таким образом решение полностью исключает риск. Это означает, что принимающий решение не может столкнуться с худшим результатом, чем тот, на который он ориентируется. Какие бы условия не встретились, соответствующий результат не может оказаться ниже W. Это свойство заставляет считать критерий Вальда одним из фундаментальных. Поэтому в технических задачах он применяется чаще всего как сознательно, так и неосознанно. Однако в практических ситуациях излишний пессимизм этого критерия может оказаться очень невыгодным.
Применение этого критерия может быть оправдано, если ситуация, в которой принимается решение, характеризуется следующими обстоятельствами:
- о вероятности появления состояния Vj ничего не известно;
- с появлением состояния Vj необходимо считаться;
- реализуется лишь малое количество решений;
- не допускается никакой риск.
2) Критерий Гурвица
Согласно критерию Гурвица выбирается такая стратегия, которая занимает некоторое промежуточное положение между крайним пессимизмом и оптимизмом. Правило выбора согласно этому критерию следующее: матрица решений дополняется столбцом, содержащим средние взвешенные наименьшего и наибольшего результатов для каждой строки. Выбирается тот вариант, в строках которого стоят наибольшие элементы этого столбца.
При a = 1 критерий Гурвица превращается в критерий Вальда (пессимиста), а при a = 0 - в критерий азартного игрока. Отсюда ясно, какое значение имеет весовой множитель a. В технических приложениях правильно выбрать этот множитель бывает так же трудно, как правильно выбрать критерий. Поэтому чаще всего весовой множитель a = 0.5 принимается в качестве средней точки зрения.
Критерий Гурвица предъявляет к ситуации, в которой принимается решение, следующие требования:
- о вероятности появления состояния ничего не известно;
- с появлением состояния необходимо считаться;
- реализуется лишь малое количество решений;
- допускается некоторый риск.
3) Критерий Сэвиджа
Суть этого критерия заключается в нахождении минимального риска. При выборе решения по этому критерию сначала матрице функции полезности (эффективности) сопоставляется матрица рисков:
элементы которой отражают убытки от ошибочного действия, т.е. выгоду, упущенную в результате принятия i-го решения в j-м состоянии. Затем по матрице выбирается решение по пессимистическому критерию Вальда, дающее наименьшее значение максимального сожаления.
В соответствии с критерием Сэвиджа в качестве оптимальной выбирается такая стратегия, при которой величина риска принимает наименьшее значение в самой неблагополучной ситуации:
Здесь величину W можно трактовать как максимальный дополнительный выигрыш, который достигается, если в определённом состоянии вместо одного варианта выбрать другой, оптимальный для этого внешнего состояния, вариант.
Соответствующее критерию Сэвиджа правило выбора следующее: каждый элемент матрицы решений вычитается из наибольшего результата max Wij соответствующего столбца. Разности образуют матрицу рисков. Эта матрица пополняется столбцом наибольших разностей. Выбирается тот вариант, в строке которого стоит наименьшее значение.
Задача
Коммерческое предприятие заключило договор на централизованную поставку овощей из теплиц на сумму 10 000 руб. ежедневно. Если в течение дня овощи не поступают, магазин имеет убытки в размере 20 000 руб. от невыполнения плана товарооборота. Магазин может осуществить самовывоз овощей фермера. Для этого он может сделать заказ в транспортном предприятии, что вызовет дополнительные расходы в размере 500 руб. Однако опыт показывает, что в половине случаев посланные машины возвращаются без овощей. Можно увеличить вероятность получения овощей от фермера до 80%, если предварительно посылать туда своего представителя, что требует дополнительных расходов в размере 400 руб. Существует возможность заказать дневную норму овощей у другого надежного поставщика - плодоовощной базы по повышенной на 50% цене. Однако в этом случае, кроме расходов на транспорт (500 руб.), возможны дополнительные издержки в размере 300 руб., связанные с трудностями реализации товара, если в тот же день поступит и централизованная поставка от фермера. Какой стратегии надлежит придерживаться магазину, если заранее неизвестно, поступит или не поступит централизованная поставка?
Решение
Перечислим все возможные стратегии.
А1 - ожидать поставку, не принимая дополнительных мер,
А2 - послать к поставщику свой транспорт,
А3 - послать к поставщику представителя и транспорт,
А4 - заказать поставку у плодоовощной базы.
П1 - поставка своевременная,
П2 - поставки нет.
Всего Стратегии предприятия | Стратегии природы | Средневзвешенное значение для каждой стратегии | ||
П1 | П2 | |||
А1 | - 10 000 | -20 000 | -14000 | |
А2 | - 10 500 | - 15 500 | -12500 | |
А3 | - 10 900 | - 12 900 | -11700 | |
А4 | - 25 800 | - 15 500 | -19620 | |
Теперь выбираем наибольшее значение для самого правого столбца.
Критерий показал на оптимальную стратегию А3, при которой предприятию необходимо посылать в теплицы машины и своего представителя.
4) Критерий Сэвиджа
Составим матрицу рисков и добавим столбец:
каждый элемент платежной матрицы вычитается из | |наибольшего результата max Wij соответствующего столбца |
П1 | П2 | Max | ||
А1 | ||||
А2 | ||||
А3 | ||||
А4 | ||||
Теперь выберем минимальное значение из столбца Max.
W=min{Max}=900
Критерий показал на оптимальную стратегию А3, при которой предприятию необходимо посылать в теплицы машины и своего представителя.
Вывод
Все критерии показали оптимальную стратегию А3, при которой магазину необходимо посылать в теплицы машины и своего представителя. Такая стратегия обеспечит магазину наименьшие расходы на покупку овощей - в сумме 12900 д.е.
Критерий Вальда
Решение.
Критерий Вальда обеспечивает выбор осторожной, пессимистической стратегии в той или иной деятельности и его суждения близки к тем суждениям, которые используют в теории игр для поиска седловой точки в пространстве чистых стратегий: для каждого решения Xi выбирается самая худшая ситуация (наименьшее из Wij) и среди них отыскивается гарантированный максимальный эффект.
В нашем примере W = max(-121, -168.75, -216.5, -264.25) = -121, т.е. по этому критерию следует закупить 20 станков и максимальный возможный убыток не превысит 121 тыс.руб.
Критерий Сэвиджа
Решение.
Суть этого критерия заключается в нахождении минимального риска. При выборе решения по этому критерию сначала матрице функции полезности (эффективности) сопоставляется матрица сожалений
элементы которой отражают убытки от ошибочного действия, т.е. выгоду, упущенную в результате принятия i-го решения в j-м состоянии. Затем по матрице D выбирается решение по пессимистическому критерию Вальда, дающее наименьшее значение максимального сожаления.
Для нашего примера отыскиваем матрицу D, вычитая (-121) из первого столбца матрицы полезности, 62 из второго и т. д.
Наибольшее значение среди минимальных элементов строк здесь равно max[-405.75, -270.5, -135.25, -143.25]=-135.25 и, покупая 40 станков, мы уверены, что в худшем случае убытки не превысят 135.25 тыс.руб.
Критерий Гурвица
Решение.
Ориентация на самый худший исход является своеобразной перестраховкой. Однако опрометчиво выбирать политику, которая излишне оптимистична. Критерий Гурвица предлагает некоторый компромисс.
где параметр a принимает значение от 0 до 1 и выступает как коэффициент оптимизма. Так в нашем примере при различных a:
W= |
a=0.1 | a=0.2 | a=0.5 | a=0.8 | a=0.9 | ||
X1=20 | -84.4 | -47.0 | 206.4 | |||
X2=30 | -113.85 | -58.95 | 105.75 | 270.45 | 325.35 | |
X3=40 | -140.3 | -70.1 | 149.5 | 369.1 | 442.3 | |
X4=50 | -172.75 | -81.25 | 193.25 | 467.75 | 559.25 |
При a =0.5 (равновероятных шансах на успех и неудачу) следует закупить 50 станков и ожидать прибыль порядка 193.25 тыс. руб.
При вероятности успеха 0.2 не следует закупать более 20 станков с надеждой, что убытки не превысят 47 тыс.руб.
32. Опишите принцип действия нейронной сети.
Нейронная сеть представляет собой совокупность большого числа сравнительно простых элементов - нейронов, топология соединений которых зависит от типа сети. В основу искусственных нейронных сетей положены следующие черты живых нейронных сетей, позволяющие им хорошо справляться с нерегулярными задачами: простой обрабатывающий элемент - нейрон, очень большое число нейронов участвует в обработке информации, один нейрон связан с большим числом других нейронов (глобальные связи), изменяющиеся по весу связи между нейронами, массированная параллельность обработки информации.
Прототипом для создания нейрона послужил биологический нейрон головного мозга. Биологический нейрон имеет тело, совокупность отростков - дендритов, по которым в нейрон поступают входные сигналы, и отросток иного рода - аксон, передающий выходной сигнал нейрона другим клеткам. Точка соединения дендрита и аксона называется синапсом. Упрощенно функционирование нейрона можно представить следующим образом.
Нейрон получает от дендритов набор (вектор) входных сигналов. В теле нейрона оценивается суммарное значение входных сигналов. Однако входы нейрона неравнозначны. Каждый вход характеризуется некоторым весовым коэффициентом, определяющим важность поступающей по нему информации. Таким образом, нейрон не просто суммирует значения входных сигналов, а вычисляет скалярное произведение вектора входных сигналов и вектора весовых коэффициентов. Далее нейрон формирует выходной сигнал, интенсивность которого зависит от значения вычисленного скалярного произведения. Если оно не превышает некоторого заданного порога, то выходной сигнал не формируется вовсе - нейрон "не срабатывает". И затем выходной сигнал поступает на аксон и передается дендритам других нейронов.
Поведение искусственной нейронной сети зависит как от значения весовых параметров, так и от функции возбуждения нейронов. Известны три основных вида функции возбуждения: пороговая, линейная и сигмоидальная. Для пороговых элементов выход устанавливается на одном из двух уровней в зависимости от того, стал ли суммарный сигнал на входе нейрона больше или меньше некоторого порогового значения. Для линейных элементов выходная активность пропорциональна суммарному взвешенному входу нейрона. Для сигмоидальных элементов в зависимости от входного сигнала выход варьируется непрерывно (но не линейно) по мере изменения входа. Сигмоидальные элементы имеют больше сходства с реальными нейронами, чем линейные или пороговые, но любой из этих типов можно рассматривать лишь как приближение.
Дальше обсудим известные модели нейронных сетей: модель Маккалоха и Питтса, модель Розенблата, модели Хопфилда и Больцмана, модель на основе обратного распространения. Также рассмотрим структуру и особенности каждой из моделей, а затем перечислим основные задачи, решаемые на основе нейронных сетей, и одновременно опишем способы реализации таких сетей.