Как уже говорилось, эта ситуация характеризуется наличием неопределенных факторов, вероятностное описание которых известно (определено). В большинстве случаев это неопределенность состояния окружающей среды, но может быть и неопределенность параметров системы и т.п. Для простоты в дальнейшем будем полагать случайными состояния внешней среды, или, как часто говорят, состояния природы.
Пусть S={s1,s2,…sn} - дискретное множество возможных состояний природы, на котором заданы вероятности P(S=si)=P(si). Или, если множество S непрерывно, плотность вероятности f(s).
Поскольку S является случайной величиной, то значение W(U,S,C) также случайная величина. Для устранения неопределенности можно провести операцию усреднения, т.е.
W(U,C) = Ms [W(U,S,C)] = i W(U,si, C)*P(si) (2.6)
Критерий (2.6) уже не является случайной величиной, и на его основе можно осуществлять ранжирование и оптимизацию альтернатив любым из рассмотренных в 1.методов.
Наиболее принципиальным и специфическим для данной ситуации моментом является отыскание законов распределения состояний природы. Эта задача решается путем априорных наблюдений, и уточнения их результатов с помощью экспериментов специально организуемых в ходе решения задачи. Т.к. наблюдения случайных величин в свою очередь являются случайными, то процедура уточнения априорных распределений строится в соответствии с идеологией, заложенной в известной формуле Байеса (теорема гипотез), и решения, получаемые на этой основе, соответственно называют байесовыми. Напомним эту формулу
P(si/x)= P(si) P(x/si) / åP(si)P(x/si) (2.7)
здеcь х- результат эксперимента, si - возможные состояния природы (гипотезы). Вероятности гипотез P(si) "i называются априорными (доопытными) и они должны быть известны, причем å P(si)=1. Также необходимо знать условные вероятности P(x/si) "i. Искомые вероятности P(s/x) апостериорными (послеопытными) вероятностями гипотез.
В случае, когда множество состояний природы непрерывно, переходят к формуле, оперирующей с априорными и апостериорными распределениями S.
Итак, эксперимент позволяет уточнить вероятность состояния среды.
Так как эксперимент подразумевает определенные затраты, можно определить цену, больше которой за него не стоит платить. Для этого необходимо посчитать среднее значение W без эксперимента, тоже при его наличии, а затем вычислить разницу, которая и будет чистой ценой эксперимента..
Вопрос о целесообразности проведения эксперимента можно решить и без вычисления его чистой цены. Для этого достаточно стоимость эксперимента рассматривать в качестве одной из компонент векторного критерия, по которому осуществляется оптимизация или ранжирование решений
Рассмотрим пример, иллюстрирующий решение задачи с использованием и без использования эксперимента.
Пусть имеются неразличимые между собой урны с черными и белыми шарами. Известно, что урн типа А - 80%, а типа В - 20%. Урна типа А содержит 7 белых и 3 черных шара, а типа В - 1 белый и 9 черных. Требуется определить тип наудачу выбранной урны. По условию игры правильный ответ приносит выигрыш (+), неправильный – проигрыш (-). Размеры платежей приведены в таблице 1 (платежная матрица). Возможны три стратегии: «а» - называем тип А, «б» - называем В, «с» - отказываемся от игры. Кроме того, играющему разрешается провести эксперимент, заключающийся в том, что перед ответом он может вынуть один шар из выбранной урны и посмотреть его цвет. Плата за право провести эксперимент указана в последнем столбце платежной матрицы.
Возможность проведения эксперимента увеличила число стратегий с трех до пяти: d1 = c, d2 = e0*a, d3 = e0*b, d4 = e*a, d5 = e*b, где «е0» означает отказ от эксперимента, а «е» его проведение.
Целью игрока является выигрыш, поэтому его величину и следует использовать для оценки качества решений. Т.к. ситуация стохастическая, то в качестве критерия оптимизации решений разумно принять ее математическое ожидание - M[W].
табл.1
a | b | с | Э | |
А | -5 | |||
В | -20 |
Mf[W]=40*0.8+0.2*(-20)=28 Mc[W]=0
Mb[W]=-5*0.8+100*0.2=16
По результатам видно, что целесообразней принять стратегию А, так как ее выбор дает в среднем больший выигрыш. Но для большой достоверности можно провести эксперимент. Допустим, выбрав урну, мы сначала вынимаем один шар, а затем определяем, к какому типу она принадлежит. Если мы вынем два шара, то точность определения урны возрастет, но эксперимент станет дороже. Также можно менять условия эксперимента. Можно вынуть шар и положить обратно, а можно отложить. Лучше шар возвращать в урну, так как среда должна оставаться реальной, а опыты независимы.
Итак, проведем опыт: будем вынимать один шар, перед тем как определить тип урны.
Появился белый шар, тогда:
вероятность, что это урна типа А
P(A/Б)= [P(A)*P(Б/A)] [P(A)*P(Б/A)+P(B)*P(Б/B)]=0.56/0.58
вероятность, что это урна типа В
P(B/Б)=1-P(A/Б)=0.02/0.58
Тогда Мб[W/a]=40*0.56/0.58-20*0.02/0.58=37,93
Мб[W/b]=4.43
Из расчетов видно, что если мы будем проводить эксперимент и вынем белый шар, а затем определим тип урны как А, то наш выигрыш по сравнению с первым случаем будет на 12 единиц выше.
Если появился черный шар, тогда:
Мч[W/а]=14.5
Мч[W/b]=40.15
Субъективные вероятности
Если рассматривать вероятность как объективную меру, то она не зависит от ЛПР. Но в некоторых случаях удобно назначать вероятности на основе собственных (экспертных,) суждений.. При таких назначениях, важно, чтобы выполнялись основные аксиомы теории вероятностей. Назначаемые таким образом вероятности называются субъективными. Существуют разные процедуры, помогающие субъекту назначать субъективные вероятности. Рассмотрим одну из них.
Метод эталонных лотерей.
Пусть играют две команды, имеющие сравнительно равные силы. Болельщики делают ставки на предполагаемого победителя Возникает задача: как организовать в помощь игрокам процедуру оценок шансов на успех (назначения субъективной вероятности). Для этого
им предлагается два типа лотерей, из которых они могут участвовать только в одной.
1-й тип. Игрок делает ставку на команду, исходя из личных симпатий и предыдущих заслуг команды.
2-й тип Обычная лотерея, в которой 100 билетов, из которых, например, только 2 выигрышных.
Если человек уверен, что выиграет команда №1, то при малом количестве выигрышных билетов во второй лотереи, он будет выбирать первую, но по мере увеличения числа выигрышных билетов во второй, он начнет колебаться в какую лотерею ему играть. При каждом изменении числа выигрышных билетов он сравнивает лотереи и делает выбор. Если, начиная с 80-ти, он выбирает первую лотерею, следовательно, он оценил вероятность выигрыша команды №1не ниже, чем 80/100.
Вторая лотерея называется эталонной, а процедуру называют назначением вероятностей с помощью эталонных лотерей., Точка, в которой становится безразлично, какую лотерею выбрать, называется точкой безразличия.
Обычно наряду с прямой лотереей проводят обратную лотерею и смотрят, где в этом случае находится точка безразличия (в принципе они должны совпадать). При этом сумма вероятностей выигрыша должна быть равна 1, иначе необходима корректировка. Кроме того, субъективные вероятности следует проверять на транзитивность.