Отличительная особенность игры с природой состоит в том, что в ней сознательно действует только один из участников, в большинстве случаев называемый игроком 1. Игрок 2 (природа) сознательно против игрока 1 не действует, а выступает как не имеющий конкретной цели и случайным образом выбирающий очередные «ходы» партнер по игре. Поэтому термин «природа» характеризует некую объективную действительность, которую не следует понимать буквально, хотя вполне могут встретиться ситуации, в которых «игроком» 2 действительно может быть природа (например, обстоятельства, связанные с погодными условиями или с природными стихийными силами).
Природа безразлична к выигрышу и не стремится обратить в свою пользу промахи статистика. Пусть статистик имеет m стратегий, а природа может реализовать n своих состояний. Если статистик имеет возможность оценить численно последствия каждой своей чистой стратегии при любом состоянии природы, то игру можно задать платежной матрицей. При упрощении платежной матрицы имеется специфика: нельзя отбрасывать те или иные стратегии “природы”, так как она может реализовать их вне зависимости от того, выгодны они статистику или нет.
При решении таких игр могут быть 2 ситуации:
- игроку А неизвестны вероятности pj, с которыми природа реализует свои состояния;
- вероятности pj известны.
Для принятия решения в таких играх используют различные критерии.
Если вероятности pj состояний природы неизвестны, то можно пользоваться критериями Вальда, Лапласа, Сэвиджа, Гурвица и пр. Основное различие между названными критериями определяется стратегией поведения лица, принимающего решение в условиях неопределенности.
Например, критерий Лапласа основан на более оптимистичных предположениях, чем критерий Вальда, но на практике встречается редко.
Критерий Гурвица можно использовать при различных подходах: от наиболее оптимистичного до наиболее пессимистичного. Таким образом, перечисленные критерии, несмотря на их количественную природу, отражают субъективную оценку ситуации, в которой статистику приходится принимать решение. К сожаленью, не существует общих правил оценки применимости того или иного критерия, так как поведение лица, принимающего решение, по всей видимости, является наиболее важным фактором при выборе подходящего критерия. Сформулируем эти критерии.
1. Критерий Лапласа
Этот критерий опирается на принцип недостаточного обоснования, по которому считается, что наступление всех состояний природы равновероятно, то есть p 1= p 2=...= p n=1/ n, а оптимальной считается стратегия Ai, обеспечивающая
Рисунок 55.
2. Критерий Ваальда (минимаксный или максминный критерий)
Этот критерий является наиболее осторожным, поскольку основан на выборе наилучшей из наихудших возможностей:
– в случае нахождения выигрыша;
– в случае нахождения потерь.
Рисунок 56.
Это пессимистические критерии.
3. Критерий Сэвиджа (минимаксного риска)
Критерий Вальда настолько пессимистичен, что может привести к нелогичным выводам. Рассмотрим следующую матрицу потерь, которая обычно приводится в качестве классического примера для обоснования “менее пессимистичного” критерия Сэвиджа.
Таблица 4.
В1 | В2 | |
А1 | ||
А2 |
Применение минимаксного критерия приводит к выбору стратегии А2, хотя интуитивно можно выбрать А1, так как при этом выборе можно надеется проиграть 90, тогда как выбор А2 всегда приводит к потерям в 10000 единиц при любом состоянии погоды.
Критерий Сэвиджа “исправляет” положение введением новой матрицы потерь, в которой заменяются на , определяемые следующим образом:
Рисунок 57.
Это означает, что есть разность между наилучшим значением в столбце j и значением .
По существу, выражает риски лица, принимающего решение, по поводу того, что он не выбрал наилучшего действия относительно состояния j. МатрицаR=() называется матрицей риска.
Найдем оптимальную стратегию предыдущей задачи по этому критерию:
.
Рисунок 58.
Применим к матрице “риска” R минимаксный критерий. Получим, что оптимальной стратегией будет– А1.
Отметим, что независимо от того, – доход или потери, – всегда потери. Поэтому к матрице “риска” всегда применяется минимаксный критерий.
4. Критерий Гурвица (пессимизма-оптимизма)
Этот критерий охватывает ряд различных подходов к принятию решений: от наиболее оптимистичного до наиболее пессимистичного.
При оптимистичном подходе выбирают стратегию, дающую:
, если
Рисунок 59
Если – прибыль, то выбирается стратегия по правилу:
Рисунок 60
Если – затраты, критерий выбирает стратегию, дающую
Рисунок 61.
Параметр интерпретируется как показатель оптимизма; при ά=1 критерий слишком оптимистичный, при ά=0 он слишком пессимистичный. Значение ά между 0 и 1 может определяться в зависимости от склонности лица, принимающего решение, к пессимизму или оптимизму. ά=0,5 представляется наиболее разумным.
Анализ практических ситуаций обычно проводится на основе нескольких критериев, что позволяет глубже исследовать суть явления.
Пример.
Одно из предприятий должно определить уровень предложения услуг, чтобы удовлетворить потребности клиентов. Точное число клиентов не известно, однако ожидается, что оно может принимать одно из следующих значений: 200, 250, 300, 350. Для каждого из этих возможных значений существует наилучший уровень предложения (с точки зрения затрат). Отклонения от этих уровней приводят к дополнительным затратам либо из-за превышения предложения над спросом, либо из-за неполного удовлетворения спроса.
Потери в зависимости от ситуации приведены в следующей таблице 5:
Таблица 5.
Клиенты Предложен. | max | ||||
a 1 | |||||
a 2 | |||||
a 3 | |||||
a 4 |
Критерий Вальда. Так как – потери, применяем минимаксный критерий.
(34)
Оптимальной стратегией будет А3.
Критерий Лапласа. Пусть стратегии 2-го игрока равновероятны.Следовательно . (35)
Тогда:
Рисунок 62
Очевидно, что наилучшим уровнем предложения в соответствии с критерием Лапласа будет стратегия А2.
Можно сделать вывод, что теория статистических решений - это теория принятия решений в условиях неопределённости в тех случаях, когда характер неопределённости может быть описан вероятностной моделью.
Во многих работах к теории статистических решений относят лишь динамические модели. Если распределение вероятностей исходных данных полностью известно, теория статистических решений, с первого взгляда, смыкается с теорией стохастической оптимизации. Настоящие проблемы возникают в ситуациях, когда указанное распределение вероятностей известно не полностью. Ну, например, если распределение задано с точностью до неизвестного параметра произвольной природы.
Формальная схема изложена в работе американского математика Ваальда и состоит из следующих элементов.
1. Конечный или бесконечный случайный вектор наблюдений Х= (Х, Х2,...). (Более строго, X - измеримое отображение, определенное на некотором исходном измеримом пространстве элементарных событий.)
2. Семейство возможных распределений вероятностей вектора наблюдений X. Как правило, полагают , где - неизвестный параметр, произвольной природы; - множеству возможных значений параметра.
3. Пространство возможных решений D = {d). Так, если = {0,1} (неизвестный параметр = 0 или 1), и задача состоит в различении двух гипотез: ={истинное значение = 0} и = {истинное значение = 1}, то естественно положить D = {0, 1}, считая, что решение d = 0 (1) соответствует принятию ().
4. Решающая функция или статистика , принимающая значения в пространстве решений , т. е. правило соответствия между значением вектора наблюдений и принимаемым решением.
Задача состоит в определении понятия «разумной» решающей функции и её поиске. Обычно, для этого вводится дополнительный элемент схемы:
5. Функция потерь - потери при решении и истинном значении неизвестного параметра .
Единица измерения потерь и сама функция определяются спецификой конкретной задачи. Например, в задаче оценивания одномерного параметра , когда решение d суть оценка , часто полагают (квадратичные потери). Могут быть задачи, где вместо потерь рассматривается «доход», возможны обобщения понятия потерь – вектор потерь и т. п.
Если принимаемое решение , то потери суть случайная величина , и нужно выбрать решающую функцию Т, порождающую наиболее «устраивающее» распределение вероятностей случайной величины . Иначе, мы должны установить отношение предпочтения на множестве возможных распределений указанной случайной величины.
Наиболее распространённый путь - минимизировать средние потери , где - операция вычисления математического ожидания в случае, когда неизвестный параметр равен . Например, при различении двух гипотез, как правило, считают , если , и , если . В этом случае , то есть вероятности принять неверное решение. Называемая функцией риска или просто риском характеристика суть функция по отношению к и функционал по отношению к решающей функции .
Особенностью теории статистических решений является тот факт, что непосредственная минимизация по Т бессмысленна, так как в нетривиальных случаях минимум достигается на решающей функции, зависящей от параметра , который неизвестен. Рассмотрим несколько вариантов преодоления указанной принципиальной трудности.
Первыйсостоит в уточнении и обогащении самого принципа оптимальности. Говорят, что решающая функция ( «лучше» ), если для всех , и хотя бы в одном случае неравенство строго. Решающая функция Парето - оптимальна или допустима, если не существует решающей функции лучше её. Ясно, что класс рассматриваемых решающих функций можно сузить до класса Парето - оптимальных решающих функций, но, диапазон последнего ещё достаточно широк.
Выбор из этого класса одного представителя должен определяться какими то, но опредеденными дополнительными соображениями.
Один из самых распространённых подходов основан на известном принципе минимакса и состоит в минимизации максимального по отношению к риска, точнее, к минимизации . Такой минимаксный подход правомерен при так называемой «равной значимости» потерь при разных значениях неизвестного параметра. В иных случаях нужны соответственно другие подходы. Так, если = {0, 1}, очень часто экзогенно вводится значение максимально допустимых потерь при , то есть вводится условие , и уже при этом условии нужно минимизировать (подход Неймана — Пирсона). В такой постановке к потерям при = 0 отношение более осторожное, чем при =1. Возможны также и иные подходы, например, минимизация функционала , где - суть представляют собой веса, и тому подобное.
Второй известный подход сводится к сужению класса рассматриваемых решающих функций, то есть к рассмотрению лишь тех из них, которые обладают дополнительными неучтеными свойствами, определяемыми спецификой конкретной задачи. Например, если в задаче оценивания - это параметр сдвига, то есть наблюдения выглядят как , где случайные величины имеют одно и то же распределение, не зависящее от , естественно использовать принцип эквивариантности, предписывающий рассматривать, лишь те решающие функции , для которых справедливо
.
Если , минимизация риска уже вполне осмыслена, так как минимум достигается на решающей функции, не зависящей от . То же верно, если — это параметр масштаба, то есть , и рассматриваются решающие функции , для которых .
Третий подход основан на известном Байесовском подходе к оцениванию, возможном, когда параметр является случайной величиной с заданным (априорным) распределением вероятностей. В этом случае есть случайная величина, у которой средние потери равны , где математическое ожидание М вычисляется относительно случайной величины , и правомерна задача минимизации . С математической точки зрения байесовский подход абсолютно безупречен, но на практике ситуации, когда априорное распределение существует и известно, весьма редки или вообще исключены.
Главным недостатком всех перечисленных подходов является то, что они привязаны к функции потерь, выбор которой, вообще говоря, часто (ксли не всегда) субъективен. Естественно в ряде ситуаций более применимы методы, которые вообще не аппелируют к понятию потерь.
Ярким примером может служить предложенный Д. Фишером метод максимального правдоподобия, используемый в задачах оценивания неизвестного параметра . Пусть распределение имеет плотность вероятностей относительно некоторой универсальной (не зависящей от ) меры . Приведенный метод основан на том соображении, что значение вектора наблюдений, как правило, попадает в зону наиболее вероятных значений, то есть в такую область, где плотность вероятностей наиболее велика. Соответственно, в большинстве отношений естественной оказывается оценка максимального правдоподобия
.
Рисунок 63.
Дальнейшее обобщение такой схемы связано с идеей рандомизации, когда при уже заданном значении вектора наблюдений X решение принимается не однозначно, как в предыдущих случаях, а с помощью некоторого случайного механизма, зависящего от X. Если говорить точнее, вектору наблюдений X ставится в соответствие не решение , а зависящее от X и определённое на D распределение вероятностей . При этом решение принимается таким образом, чтобы вероятность того, что при уже наблюдаемом решение , равнялась . Если распределение оказывается вырожденным в некоторой точке , схема сводится к предыдущей. В случае рандомизации случайные потери равны , где математическое ожидание берётся относительно случайной величины d, имеющей распределение вероятностей . Риск в этом случае соответственно равен . Рандомизация совсем не исключает применения всех вышеупомянутых подходов. Надо отметить, что при некоторых, не слишком обременительных условиях типа выпуклости и гладкости исходных распределений рандомизация не приводит к фактическому уменьшению риска.
Динамические модели, в основном, укладываются в построенную схему, но при этом и обладают некоторой спецификой. Компонента вектора наблюдений интерпретируется как собственно наблюдение в момент времени t=l,...,n, где или (конечное время наблюдений), или (время наблюдений бесконечно). Каждому t соответствует пространство решений . Соответственно решение в момент t определяется функцией , принимающей значения в . (В рамках предыдущей схемы сказанному соответствуют соотношения и ). При этом однако предполагается, что то есть решение принимается лишь на основе значений вектора наблюдений. Типичным примером функции потерь в динамической ситуации служит функция — , где интерпретируется как потери в момент при наблюдении и решении , а всё выражение понимается - как средние потери на единицу времени при общем времени . Если , можно рассматривать, скажем, верхний предел последнего выражения. Необходимо отметить, что динамическая схема принятия решений содержит все перечисленные выше подходы.
Одной из наиболее известных идей, используемых при исследовании динамических моделей, является также принадлежащая А. Ваальду идея последовательного статистического анализа, которая состоит в предложении отказаться от априорной фиксации числа наблюдений и в каждый момент времени, на основе наблюдаемых значений компонент вектора наблюдений, решать вопрос: продолжать наблюдения или уже достаточно. В данной постановке каждое из пространств содержит специфическое решение - продолжить наблюдения, а все остальные решения носят характер - окончательных так как при их принятии наблюдения заканчиваются. В этом случае число наблюдений, конечно, будет уже случайной величиной, структура которой определяется выбранной последовательностью решающей функции .
При прочих равных условиях применение последовательного анализа позволяет уменьшить средние потери или другими словами среднее время наблюдений. Одним из наиболее известных в этом отношении примеров может служить последовательный критерий отношения вероятностей при различении двух гипотез при которых применение последовательного анализа приводит в этой задаче к существенному снижению требуемого объёма выборки при тех же вероятностях ошибок в принятии решений.
Модели стратегических игр, в экономической практике могут не в полной мере, а чаще всего и оказываются не адекватными действительности, поскольку реализация модели предполагает многократность повторения действий (решений), предпринимаемых в похожих условиях. В практике количество принимаемых экономических решений в неизменных условиях жестко ограничено. Часто экономическая ситуация является уникальной, так как проявляются неучтенные в предыдущем случае факторы, а решение в условиях неопределенности должно приниматься однократно. С этим связано необходимость развития методов моделирования принятия решений в условиях неопределенности и риска.
Традиционно следующим этапом такого развития являются так называемые игры с «природой». Формально изучение “игр с природой“, так же как и стратегических, должно начинаться с построения платежной матрицы, что является, по существу, наиболее трудоемким этапом подготовки принятия решения. Ошибки в платежной матрице не могут быть компенсированы никакими вычислительными методами и могут привести к неверному итоговому результату.