Основные понятия последовательного анализа. Задача принятия решений в условиях неопределенности

В предыдущих разделах данной главы предполагалось, что объем выборки, на основе которой выносится решение, фиксирован. В § 5.3 уже отмечалось, что значение риска, связанного с принятием решений, уменьшается при увеличении числа наблюдений. Вообще механизм вынесения решений может быть «выбран таким образом, чтобы» кроме основных решений, он позволял определять и необходимый объем выборки. Можно ожидать, что в этом случае удалось бы сократить время от начала наблюдения до принятия решения при том же самом значении было бы построено правило выбора решения, которое следовало бы признать лучше правила, основанного на выборке фиксированного объема. В данном параграфе будут изучены два таких последовательных правила (выбора решения для простого бинарного случая. Одно из них называется байесовским, а другое - последовательным правилом Вальда .

Напомним, что при проверке гипотез по выборке фиксированного объема отношение правдоподобия сравнивается с порогом . При последовательном анализе используются два порога и , которые могут изменяться с изменением числа наблюдений . Если на -м шаге отношение правдоподобия больше порога , то принимается гипотеза . Если оно меньше, чем , то принимается гипотеза . Если же значение отношения правдоподобия лежит между этими порогами, то необходимо произвести очередное наблюдение.

Отношение правдоподобия

где - совместная плотность вероятности выборки при гипотезе , (полученной за первые шагов. Для вычисления порога непоследовательного правила выбора решения необходимо знать априорные вероятности гипотез и . Аналогично для определения порогов последовательного правила на -м шаге необходимо знать априорные вероятности и этих гипотез перед -м шагом. Эти априорные вероятности можно рассматривать как апостериорные, вычисляемые после первых шагов. Их можно определить из соотношений:

Поделив обе части последнего выражения на соответствующие части предыдущего, получим простое выражение для отношения априорных вероятностей на -м шаге

. (5.109)

В качестве начального значения в этом соотношении следует выбрать отношение , которое использовалось бы при построении непоследовательного правила. На каждом шаге отношение априорных вероятностей подстраивается путем умножения на отношение правдоподобия :

. (5.110)

зависящее только от результатов наблюдений на предшествующих шагах. Если элементы выборки независимы, то отношение правдоподобия для «всей выборки можно записать как произведение отношений правдоподобия для наблюдений на разных шагах:

то рекуррентное соотношение (5.109) можно записать в следующей полезной форме:

. (5.113)

Определить среднее значение потерь при наличии решений о продолжении наблюдений (что необходимо при рассмотрении байесовского последовательного правила) довольно трудно. Поэтому обратимся к более простому подходу, предложенному Вальдом . Это правило, называемое обычно последовательным правилом Вальда, является модификацией непоследовательного правила Неймана-Пирсона.

Покажем, что пороги и последовательного правила Вальда связаны простыми соотношениями с вероятностями ложной тревоги и пропуска сигнала. Предположим, что при отношение правдоподобия оказалось равным порогу .

Следовательно, на этом шаге принимается гипотеза и

. (5.114)

Умножая обе части последнего равенства на величину и интегрируя в области принятия гипотезы получим

Это равенство можно записать следующим образом:

Если отношение правдоподобия равно значению порога , то принимается гипотеза . Поскольку при этом

, (5.117)

то нетрудно установить равенство, аналогичное равенству (5.116)

Из равенств (5.116) и (5.118) следует, что для обеспечения заданных значений вероятностей ложной тревоги и пропуска сигнала следует выбрать следующие значения порогов:

(5.119)

Из этих выражений, в частности, следует, что значения порогов последовательного правила Вальда не зависят от номера наблюдения , если вероятности и не зависят от .

При использовании последовательного правила объем выборки, при котором принимается одна из рассмотренных гипотез, оказывается случайным (можно показать, что одна из гипотез всегда принимается в результате конечного числа шагов). Поэтому желательно определить хотя бы среднее значение необходимого числа наблюдений. Предположим, что пересечение порогов невозможно Тогда существуют всего две возможности при завершении проверки: достигается либо порог , либо порог . Поскольку при этом может быть справедливой либо гипотеза , либо гипотеза , то возможны следующие четыре комбинации при окончании проверки на -м шаге:

(5.120)

Среднее значение отношения правдоподобия при окончании наблюдений (при объеме выборки )

(5.121)

Вычислим теперь отношение правдоподобия для , предположив для простоты, что элементы выборки независимы и одинаково распределены. В этом случае справедливо представление (5.111) при . Поэтому можно записать

Правую часть этого равенства можно рассматривать как произведение двух независимых случайных величин. Вычисляя натуральный логарифм от обеих частей этого равенства, получим

Найдем теперь математические ожидания обеих частей полученного равенства:

Здесь предполагается, что математическое ожидание не зависит от номера наблюдения . Равенство (5.124) записано с учетом того, что

Формулу (5.121) можно записать в несколько ином виде:

Учитывая теперь равенство (5.125), для математического ожидания объема выборки получаем

(5.127)

Интересно сравнить последовательное правило с аналогичным правилом, использующим выборку фиксированного объема. Такое сравнение для задачи с нормальными случайными величинами, дисперсии которых известны и одинаковы при рассматриваемых гипотезах, проведено в примере 5.5. Результаты сравнения для случая непрерывного времени будут приведены позже.

Пример 5.5 . Снова рассмотрим простую задачу различения двух гипотез:

где положительный параметр известен, т.е. гипотеза о среднем значении нормальной случайной величины с известной дисперсией проверяется против простой альтернативы. Как уже отмечалось ранее, при отыскании правила различения гипотез можно использовать различные подходы. Найдем теперь последовательное правило выбора решения. Ради простоты будем предполагать, что элементы выборки независимы (иногда в таком случае говорят, что шум измерения белый)

Согласно ф-ле (5.106) отношение правдоподобия

Значения порогов последовательного правила можно вычислить по ф-ле (5.119), если задать и считать постоянными вероятности ложной тревоги и пропуска сигнала, так что

Таким образом, последовательное правило выбора решения можно записать следующим образом если

,

то принимается гипотеза , если

,

то следует провести еще одно наблюдение, если

,

то принимается гипотеза .

Как и при выборке фиксированного объема, функцию от выборки можно рассматривать как достаточную статистику Пороги построенного таким образом последовательного правила изменяются с ростом номера наблюдения, (см рис.5.9). Разница между значениями порогов постоянна и равна

.

Рис.5.9 Пороги как функции числа наблюдений, тангенс угла наклона соответствующих прямых равен

Так как , то

Средний объем выборки, необходимой для принятия одной из рассматриваемых гипотез, можно вычислить по ф-ле (5.127) В результате получаем

Сравним теперь средний объем выборки, требуемый для принятия окончательного решения с помощью последовательного правила, с объемом выборки, который необходим для достижения тех же значений вероятностей ложной тревоги и пропуска сигнала при применении непоследовательного правила В примере 5.2 уже было показано, что для рассмотренного там непоследовательного правила выбора решения можно записать

;

,

где порог при использовании достаточной статистики определяется соотношением , а - порог этого правила. Зададим теперь некоторые значения вероятностей ложной тревоги и пропуска сигнала для этого непоследовательного правила Неймана-Пирсона и найдем требуемый объем выборки. Из трех предыдущих равенств получаем

Отсюда объем выборки, необходимый для обеспечения заданных вероятностей ошибок при использовании правила Неймана-Пирсона,

.

Это выражение получено из двух предыдущих равенств путем исключения переменной . Таким образом, для обоих рассматриваемых правил необходимое число наблюдений растет с увеличением дисперсии и уменьшается с ростом .

Интересно отметить, что объем выборки явно не зависит от порога правила , как это следовало бы ожидать, поскольку порог должен выбираться так, чтобы обеспечить заданные значения вероятностей и . Особенно важным является отношение . Значение этого отношения при заданных вероятностях и зависит от того, какая из гипотез справедлива. На рис 5.10 приведены графики изменения этого отношения при гипотезе .

Рис.5.10 Отношение объема выборки непоследовательного правила к среднему объему выборки последовательного правила при вероятностях ложной тревоги и пропуска сигнала, одинаковых для обоих правил, справедлива гипотеза

Оказывается что при использован и последовательного правила требуется в среднем меньший объем выборки, чем для непоследовательного. И эта экономия среднего числа наблюдений становится существенной при малых значениях вероятностей и .

Пример 5.6. Рассмотрим теперь задачу предыдущего примера, предположив, однако, что число отсчетов значений наблюдаемого процесса на конечном интервале времени может быть неограниченно увеличено. Это позволит построить последовательное правило выбора решения при непрерывном времени. Рассматриваемые гипотезы можно описать следующим образом:

где значение параметра известно, a - стационарный белый нормальный шум, среднее значение которого равно нулю, а ковариационная функция

Начнем с отсчетов непрерывного наблюдаемого процесса в дискретные моменты времени и примем, что

т.е. при любом элементы выборки предполагаются независимыми. Для этого частного случая отношение правдоподобия, рассматривавшееся в предыдущем примере, примет вид

Полученные в этом разделе соотношения можно легко модифицировать с тем, чтобы охватить задачи проверки сложных гипотез с помощью последовательных правил. Последовательность рассуждений при этом полностью совпадает с той, которая подробно описана в § 5.4.

Здесь следует использовать отношение правдоподобия

,
которое при наличии случайного параметра можно записать следующим образом:

. (5.128)

Последовательное правило проверки сложных гипотез после этого строится, как последовательное правило проверки соответствующих простых гипотез.

Вероятности ложной тревоги и пропуска сигнала в этом случае зависят от значения параметра, таr как

, (5.133)

в котором оценки максимального правдоподобия неизвестного параметра отыскиваются путем максимизации соответствующих условных плотностей вероятности но допустимым областям значений при фиксированной выборке .

Можно рассмотреть также задачу проверки нескольких гипотез с помощью последовательного правила. При этом необходимо ввести вероятности нескольких ошибок, которые служат аналогами вероятностей ложного обнаружения и пропуска сигнала. Соотношения, получающиеся при решении этой задачи, полностью аналогичны тем, которые были получены для бинарного случая.

Поскольку объем выборки, используемой для вынесения окончательного решения с помощью последовательного правила, является случайной величиной с математическим ожиданием то может оказаться необходимым ограничить максимально допустимое число наблюдений или время наблюдения. То есть, если после получения наблюдений окончательное решение с помощью последовательного правила не принято, то для выбора одной из рассматривающихся гипотез используется другое правило:

Вальд указал границы для вероятностей ложной тревоги и пропуска сигнала подобных усеченных последовательных правил.

В примерах данного раздела были рассмотрены простые задачи последовательного анализа для нормальных случайных величин. Теперь перейдем к анализу более полезного варианта этой задачи, который будет играть очень важную роль при изложении в гл. 7 результатов, полученных Калманом при решении задач фильтрации.

Глава 2. Принятие решений в условиях неопределенности

2.7. Критерий Вальда

Критерий Вальда является самым "осторожным". Согласно ему, оптимальной альтернативой будет та, которая обеспечивает наилучший исход среди всех возможных альтернатив при самом плохом стечении обстоятельств.

Если исходы отражают подлежащие минимизации показатели (убытки, расходы, потери и т.д.), то критерий Вальда ориентируется на "минимакс" (минимум среди максимальных значений потерь всех альтернатив).

Если в качестве исходов альтернатив фигурируют показатели прибыли, дохода и других показателей, которые надо максимизировать (по принципу "чем больше, тем лучше"), то ищется "максимин" выигрыша (максимум среди минимальных выигрышей). Здесь и далее для всех критериев в тексте мы будем рассматривать именно такой случай, когда исход показывает некий выигрыш.

По критерию Вальда оценкой i -й альтернативы является ее наименьший выигрыш:

W i = min (x ij ) , j = 1..M

Оптимальной признается альтернатива с максимальным наихудшим выигрышем:

Х* = Х k , W k = max (W i ) , i = 1..N

Пример применения критерия Вальда

Есть два проекта Х 1 и Х 2 , которые при трех возможных сценариях развития региона (j=1..3) обеспечивают разную прибыль. Значения прибыли приведены в таблице 2.2. Необходимо выбрать проект для реализации.

Среди возможных проектов нет доминирующих ни абсолютно, ни по состояниям. Поэтому решение придется принимать по критериям.

Если выбор оптимального проекта осуществляется по критерию Вальда, то ЛПР должен выполнить следующие действия:

1. Найти минимальные исходы для каждой альтернативы. Это и будут значения критерия Вальда:

W 1 = min (x 1j), j = 1..3 => W 1 = min (45, 25, 50) = 25

W 2 = min (x 2j), j = 1..3 => W 2 = min (20, 60, 25) = 20

2. Сравнить значения критерия Вальда и найти наибольшую величину. Альтернатива с максимальным значением критерия будет считаться оптимальной:

25 > 20 => W 1 > W 2 => X* = X 1

Если бы решение принималось только по критерию Вальда, ЛПР выбрал для реализации проект Х 1 , поскольку прибыль, которую обеспечит данный проект при самом плохом развитии ситуации, выше.

Выбрав оптимальную альтернативу по критерию Вальда, ЛПР гарантирует себе, что при самом плохом стечении обстоятельств он не получит меньше, чем значение критерия. Поэтому данный показатель еще называют критерием гарантированного результата .

Основной проблемой критерия Вальда является его излишняя пессимистичность, и, как следствие, не всегда логичный результат. Так, например, при выборе по данному критерию между альтернативами А{100; 500} и В{90; 1000} следует остановиться на варианте А . Однако в жизни логичнее было бы выбрать В , так как в худшем случае В лишь немного хуже А , тогда как при хорошем стечении обстоятельств В обеспечивает гораздо больший выигрыш.

Краткая теория

Любую хозяйственную деятельность человека можно рассматривать как игру с природой. В широком смысле под природой будем понимать совокупность неопределенных факторов, влияющих на эффективность принимаемых решений.

Управление любым объектом осуществляется путем принятия последовательности управленческих решений. Для принятия решения необходима информация (совокупность сведений о состоянии объекта управления и условиях его работы). В тех случаях когда отсутствует достаточно полная информация, возникает неопределенность в принятии решения. Причины этого могут быть различны: требующаяся для полного обоснования решения информация принципиально не может быть получена (неустранимая неопределенность); информация не может быть получена своевременно, к моменту принятия решения; затраты, связанные с получением информации, слишком высоки. По мере совершенствования средств сбора, передачи и обработки информации неопределенность управленческих решении будет уменьшаться. К этому нужно стремиться. Существование неустранимой неопределенности связано со случайным характером многих явлений. Например, в торговле, случайный характер изменения спроса делает невозможным его точное прогнозирование, a, следовательно, и формирование идеально точного заказа на поставку товара. Принятие решения в этом случае связано с риском. Приемка партии товара на основании выборочного контроля также связана с риском принятия решения в условиях неопределенности. Неопределенность может быть снята путем полного контроля всей партии, однако это может оказаться слишком дорогостоящим мероприятием. В сельском хозяйстве, например, с целью получения урожая человек предпринимает ряд действии (пашет землю, вносит удобрения, борется с сорняками и т. п.). Окончательный результат (урожай) зависит от действий не только человека, но и природы (дождь, засуха, вечер и т. п.). Из приведенных примеров видно, что полностью исключить неопределенность в управлении экономической системой нельзя, хотя, повторим, к этому нужно стремиться. В каждом конкретном случае следует принимать во внимание степень риска при принятии управленческих решений, по возможности максимально учитывать имеющуюся информацию с целью уменьшения неблагоприятных последствий, которые могут возникнуть из-за ошибочных решений.

Две стороны, участвующие в игре, будем называть игрок I и игрок II. Каждый из игроков располагает конечным набором действий (чистых стратегий), которые он может применять в процессе игры. Игра имеет повторяющийся, циклический характер. о каждом цикле игроки выбирают одну из своих стратегии, что однозначно определяет платеж . Интересы игроков противоположны. Игрок I старается вести игру так, чтобы платежи были как можно большими. Для игрока II желательны как можно меньшие значения платежей (с учетом знака). Причем в каждом цикле выигрыш одного из игроков в точности совпадает с проигрышем другого. Игры такого типа называются играми с нулевой суммой.

Решить игру - значит определить оптимальное поведение игроков. Решение игр является предметом теории игр. Оптимальное поведение игрока инвариантно относительно изменения всех элементов платежной матрицы на некоторую величину.

В общем случае определение оптимального поведения игроков связано с решением двойственной пары задач линейного программирования. В отдельных случаях могут быть использованы более простые методы. Часто платежную матрицу удается упростить путем удаления из нее строк и столбцов, соответствующих доминируемым стратегиям игроков, доминируемой называется стратегия, все платежи которой не лучше соответствующих платежей некоторой другой стратегии и хотя бы один из платежей хуже соответствующего платежа этой другой стратегии, называемой доминирующей.

В обычной стратегической игре принимают участие «разумные и антагонистические» противники (противоборствующие стороны). В таких играх каждая из сторон предпринимает именно те действия, которые наиболее выгодны ей и менее выгодны противнику. Однако очень часто неопределенность, сопровождающая некоторую операцию, не связана с сознательным противодействием противника, а зависит от некой, не известной игроку I объективной действительности (природы). Такого рода ситуации принято называть играми с природой. Игрок II - природа - в теории статистических игр не является разумным игроком, так как рассматривается как некая незаинтересованная инстанция, которая не выбирает для себя оптимальных стратегий. Возможные состояния природы (ее стратегии) реализуются случайным образом. В исследовании операций оперирующую сторону (игрока I) часто называют статистиком, а сами операции - играми статистика с природой или статистическими играми.

Рассмотрим игровую постановку задачи принятия решения в условиях неопределенности. Пусть оперирующей стороне необходимо выполнить операцию в недостаточно известной обстановке относительно состояний которой можно сделать предположений. Эти предположения будем рассматривать как стратегии природы. Оперирующая сторона в своем распоряжении имеет возможных стратегий - . Выигрыши игрока I при каждой паре стратегий и - предполагаются известными и заданы платежной матрицей .

Задача заключается в определении такой стратегии (чистой или смешанной), которая лри ее применении обеспечила бы оперирующей стороне наибольший выигрыш.

Выше уже говорилось, что хозяйственная деятельность человека может рассматриваться как игра с природой. Основной особенностью природы как игрока является ее не заинтересованность в выигрыше.

Анализ матрицы выигрышей игры с природой начинается с выявления и отбрасывания дублирующих и заведомо невыгодных стратегий лица, играющего с природой. Что касается стратегий природы, то ни одну из них отбросить нельзя, так как каждое из состояний природы может наступить случайным образом, независимо от действий игрока I. Ввиду того что природа не противодействует игроку I, может показаться, что игра с природой проще стратегической игры. На самом деле это не так. Противоположность интересов игроков в стратегической игре в некотором смысле как бы снимает неопределенность, чего нельзя сказать о статистической игре. Оперирующей стороне в игре с природой легче в том отношении, что она скорее.всего выиграет больше, чем в игре против сознательного противника. Однако ей труднее принять обоснованное решение, так как в игре с природой неопределенность ситуации сказывается в гораздо более сильной степени.

После упрощения платежной матрицы игры с природой целесообразно не только оценить выигрыш при той или иной игровой ситуации, но и определить разность между максимально возможным выигрышем при данном состоянии природы и выигрышем, который будет получен при применении стратегии в тех же условиях. Эта разность в теории игр называется риском.

Природа меняет состояние стихийно, совершенно не заботясь о результате игры. В антагонистической игре мы предполагали, что игроки пользуются оптимальными (в определенном выше смысле) смешанными стратегиями. Можно предположить, что природа применяет наверняка не оптимальную стратегию. Тогда какую? Если бы существовал ответ на этот вопрос, то принятие решения лицом, принимающим решения (ЛПР) сводилось бы к детерминированной задаче.

Если вероятности состояний природы известны, то пользуются критерием Байеса, в соответствии с которым оптимальной считается чистая стратегия , при которой максимизируется средний выигрыш:

Критерий Байеса предполагает, что нам хотя и неизвестны условиях выполнения операций (состояния природы) , но известны их вероятности .

С помощью такого приема задача о выборе решения в условиях неопределенности превращается в задачу о выборе решения в условиях определенности, только принятое решение является оптимальным не в каждом отдельном случае, а в среднем.

Если игроку представляются в равной мере правдоподобными все состояния природы, то иногда полагают и, учитывая, «принцип недостаточного основания» Лапласа, оптимальной считают чистую стратегию , обеспечивающую:

Если же смешанная стратегия природы неизвестна, то в зависимости от гипотезы о поведении природы можно предложить ряд подходов для обоснования выбора решения ЛПР. Свою оценку характера поведения природы будем характеризовать числом , которое можно связывать со степенью активного «противодействия» природы как игрока Значение соответствует наиболее пессимистичному отношению ЛПР в смысле «содействия» природы в достижении им наилучших хозяйственных результатов. Значение соответствует наибольшему оптимизму ЛПР. Как известно, в хозяйственной деятельности указанные крайности опасны. Скорее всего, целесообразно исходить из некоторого промежуточного значения . В этом случае используется критерий Гурвица, согласно которому наилучшим решением ЛПР является чистая стратегия , соответствующая условию:

Критерий Гурвица (критерий «оптимизма-пессимизма») позволяет руководствоваться при выборе рискового решения в условиях неопределенности некоторым средним результатом эффективности, находящимся в поле между значениями по критериям «максимакса» и «максимина» (поле между этими значениями связано посредством выпуклой линейной функции).

В случае крайнего пессимизма ЛПР указанный критерий называется критерием Вальда. Согласно этому критерию, наилучшей считается максиминная стратегия. Это критерий крайнего пессимизма. По этому критерию ЛПР выбирает ту стратегию, которая гарантирует в наихудших условиях максимальный выигрыш:

Такой выбор соответствует наиболее робкому поведению ЛПР, когда он предполагает наиболее, неблагоприятное поведение природы, боится больших потерь. Можно предположить, что он не получит больших выигрышей. Согласно критерию Сэвиджа, следует выбирать чистую стратегию соответствующую условию:

где риск .

Критерий Сэвиджа (критерий потерь от «минимакса») предполагает, что из всех возможных вариантов «матрицы решений» выбирается та альтернатива, которая минимизирует размеры максимальных потерь по каждому из возможных решений. При использовании этого критерия «матрица решения» преобразуется в «матрицу риска», в которой вместо значений эффективности проставляются размеры потерь при различных вариантах развития событий.

Недостатком критериев Вальда, Сэвиджа и Гурвица является субъективная оценка поведения природы. Хотя указанные критерии и дают некоторую логическую схему принятия решений, резонно все же задать вопрос: «А почему сразу не выбрать субъективное решение, вместо того чтобы иметь дело с разными критериями?» Несомненно, определение решения по различным критериям помогает ЛПР оценить принимаемое решение с различных позиций и избежать грубых ошибок в хозяйственной деятельности.

Пример решения задачи

Условие задачи

После нескольких лет эксплуатации оборудование может оказаться в одном из трех состояний:

  1. требуется профилактический ремонт;
  2. требуется замена отдельных деталей и узлов;
  3. требуется капитальный ремонт.

В зависимости от ситуации руководство предприятия может принять следующие решения:

Требуется найти оптимальное решение данной проблемы по критерию минимизации затрат с учетом следующих предположений:

a 4 6 9 b 5 3 7 c 20 15 6 q 0.4 0.45 0.15

Решение задачи

Если возникли сложности с решением задач, то сайт сайт оказывает онлайн помощь студентам по методам оптимальных решений с контрольными или экзаменами.

Игра парная, статистическая. В игре участвуют 2 игрока: руководство предприятия и природа.

Под природой в данном случае понимаем совокупность внешних факторов, которые определяют состояние оборудования.

Стратегия руководства:

Отремонтировать оборудование своими силами

Вызвать бригаду специалистов

Заменить оборудование новым

Стратегия природы - 3 возможных состояния оборудования.

Требуется профилактический ремонт;

Следует заменить отдельные детали и узлы;

Требуется капитальный ремонт.

Расчет платежной матрицы и матрицы рисков

Поскольку элементы матрицы - затраты, то будем считать их выигрышными но со знаком минус. Платежная матрица:

-4 -6 -9 -9 -5 -3 -7 -7 -20 -15 -6 -20 0.4 0.45 0.15

Составляем матрицу рисков:

-4-(-20)=16 -6-(-15)=9 -9-(-9)=0 16 -5-(-20)=15 -3-(-15)=12 -7-(-9)=2 15 -20-(-20)=0 -15-(-15)=0 -6-(-9)=3 3

Критерий Байеса

Определяем средние выигрыши:

По критерию Байеса оптимальной является стратегия - вызвать бригаду специалистов

Критерий Лапласа

Определим средние выигрыши:

По критерию Лапласа оптимальной является стратегия - вызвать бригаду специалистов

Критерий Вальда

По критерию Вальда оптимальной является стратегия - вызвать бригаду специалистов

Критерий Сэвиджа

По критерию Сэвиджа оптимальной является стратегия - заменить оборудование новым

Критерий Гурвица

По критерию Гурвица оптимальной является стратегия - вызвать бригаду специалистов

Ответ

По всем критериям, за исключением критерия Сэвиджа, оптимальной является стратегия «Вызвать бригаду специалистов». По критерию Сэвиджа, который минимизирует риски, оптимальной является стратегия «Заменить оборудование новым».


Содержит изложенные в краткой и доступной форме теоретические сведения о матричной игре без седловой точки и способе сведения такой задачи к задаче линейного программирования, для отыскания ее решения в смешанных стратегиях. Приведен пример решения задачи.

Многоканальная СМО с неограниченной очередью
Приведены необходимые теоретические сведения и образец решения задачи по теме "Многоканальная система массового обслуживания с неограниченной очередью", подробно рассмотрены показатели многоканальной системы массового обслуживания (СМО) с ожиданием обслуживания - среднее число каналов, занятых обслуживанием заявки, длина очереди, вероятность образования очереди, вероятность свободного состояния системы, среднее время ожидания в очереди.

Критический путь, критическое время и другие параметры сетевого графика работ
На примере решения задачи рассмотрены вопросы построения сетевого графика работ, нахождение критического пути и критического времени. Также показано вычисление параметров и резервов событий и работ - ранних и поздних сроков, общих (полных) и частных резервов.

Предположим, что ЛПР (лицо, принимающее решения) рассматривает несколько возможных решений: i = 1,…,m. Ситуация, в которой действует ЛПР, является неопределенной. Известно лишь, что наличествует какой-то из вариантов: j = 1,…, n. Если будет принято i -e решение, а ситуация есть j -я, то фирма, возглавляемая ЛПР, получит доход q ij . Матрица Q = (q ij) называется матрицей последствий (возможных решений). Какое же решение нужно принять ЛПР? В этой ситуации полной неопределенности могут быть высказаны лишь некоторые рекомендации предварительного характера. Они не обязательно будут приняты ЛПР. Многое будет зависеть, например, от его склонности к риску. Но как оценить риск в данной схеме?
Допустим, мы хотим оценить риск, который несет i -e решение. Нам неизвестна реальная ситуация. Но если бы ее знали, то выбрали бы наилучшее решение, т.е. приносящее наибольший доход. Т.е. если ситуация есть j -я, то было бы принято решение, дающее доход q ij .
Значит, принимая i -e решение мы рискуем получить не q j , а только q ij , значит принятие i -го решения несет риск недобрать r ij = q j - q ij . Матрица R = (r ij) называется матрицей рисков.

Пример №1 . Пусть матрица последствий есть
Составим матрицу рисков. Имеем q 1 = max(q i 1) = 8, q 2 = 5, q 3 = 8, q 4 = 12.. Следовательно, матрица рисков есть

Принятие решений в условиях полной неопределенности

Не все случайное можно "измерить" вероятностью. Неопределенность – более широкое понятие. Неопределенность того, какой цифрой вверх ляжет игральный кубик отличается от неопределенности того, каково будет состояние российской экономики через 15 лет. Кратко говоря, уникальные единичные случайные явления связаны с неопределенностью, массовые случайные явления обязательно допускают некоторые закономерности вероятностного характера.
Ситуация полной неопределенности характеризуется отсутствием какой бы то ни было дополнительной информации. Какие же существуют правила-рекомендации по принятию решений в этой ситуации?

Правило Вальда (правило крайнего пессимизма). Рассматривая i -e решение будем полагать, что на самом деле ситуация складывается самая плохая, т.е. приносящая самый малый доход a i Но теперь уж выберем решение i0 с наибольшим ai0 . Итак, правило Вальда рекомендует принять решение i0 , такое что
Так, в вышеуказанном примере, имеем a 1 = 2, a 2 = 2, a 3 = 3, a 4 = 1. Из этих чисел максимальным является число 3. Значит, правило Вальда рекомендует принять 3-е решение.

Правило Сэвиджа (правило минимального риска). При применении этого правила анализируется матрица рисков R = (rij) . Рассматривая i -e решение будем полагать, что на самом деле складывается ситуация максимального риска b i = max
Но теперь уж выберем решение i0 с наименьшим bi0 . Итак, правило Сэвиджа рекомендует принять решение i0 , такое что
В рассматриваемом примере имеем b 1 = 8, b 2 = 6, b 3 = 5, b 4 = 7 . Минимальным из этих чисел является число 5. Т.е. правило Сэвиджа рекомендует принять 3-е решение.

Правило Гурвица (взвешивающее пессимистический и оптимистический подходы к ситуации). Принимается решение i , на котором достигается максимум
, где 0 ≤ λ ≤ 1 .
Значение λ выбирается из субъективных соображений. Если λ приближается к 1, то правило Гурвица приближается к правилу Вальда, при приближении λ к 0, правило Гурвица приближается к правилу "розового оптимизма" (догадайтесь сами, что это значит). В вышеуказанном примере при λ = 1/2 правило Гурвица рекомендует 2-е решение.

Принятие решений в условиях частичной неопределенности

Предположим, что в рассматриваемой схеме известны вероятности pj того, что реальная ситуация развивается по варианту j . Именно такое положение называется частичной неопределенностью. Как здесь принимать решение? Можно выбрать одно из следующих правил.
Правило максимизации среднего ожидаемого дохода. Доход, получаемый фирмой при реализации i -го решения, является случайной величиной Qi с рядом распределения

qi1

qi2


qin

p1

p2


pn

Математическое ожидание M и есть средний ожидаемый доход, обозначаемый . Правило рекомендует принять решение, приносящее максимальный средний ожидаемый доход.
Предположим, что в схеме из предыдущего примера вероятности есть (1/2, 1/6, 1/6, 1/6). Тогда Максимальный средний ожидаемый доход равен 7, соответствует третьему решению.
Правило минимизации среднего ожидаемого риска. Риск фирмы при реализации i -го решения, является случайной величиной R i с рядом распределения

ri1

ri2


rin

p1

p2


pn

Математическое ожидание M и есть средний ожидаемый риск, обозначаемый также . Правило рекомендует принять решение, влекущее минимальный средний ожидаемый риск.
Вычислим средние ожидаемые риски при указанных выше вероятностях. Получаем Минимальный средний ожидаемый риск равен 7/6, соответствует третьему решению.
Анализ принимаемых решений по двум критериям: среднему ожидаемому доходу и среднему ожидаемому риску и нахождение решений, оптимальных по Парето, аналогично анализу доходности и риска финансовых операций. В примере множество решений, оптимальных по Парето операций, состоит только из одного 3-его решения.
В случае, если количество Парето-оптимальных решений больше одного, то для определения лучшего решения применяется взвешивающая формула .

Правило Лапласа

Иногда в условиях полной неопределенности применяют правило Лапласа, согласно которому все вероятности p j считают равными. После этого можно выбрать какое-нибудь из двух приведенных выше правил-рекомендаций принятия решений.

      16 - отказ от реализации проекта (избежание, риска)

Рис. 1.2. Блок-схема процесса управления риском

3. Количественный анализ предполагает определение вероятности наступления риска и его последствий, определение допустимого уровня риска.

Наиболее распространенными методами количественной оценки риска являются статистические методы и методы экспертных оценок.

Суть статистических методов заключается в том, что изучается статистика потерь и прибылей, имевших место в данной области, и составляется наиболее вероятный прогноз на будущее. Данные методы требуют наличия значительного массива данных и соответствующего математического сопровождения.

Использование методов экспертных оценок заключается в получении количественных оценок риска на основании обработки мнений опытных предпринимателей или специалистов.

4. Меры по устранению и минимизации риска включают следующие шаги:

  • оценку приемлемости полученного уровня риска;
  • оценку возможности снижения риска или его увеличения при повышении ожидаемой отдачи;
  • выбор методов снижения (увеличения) рисков.

Тема 2. Количественные характеристики и схемы оценки рисков в условиях неопределенности.

Матрица последствий. Матрица рисков. Анализ связанной группы решений в условиях полной неопределенности. Правило Вальда. Правило Сэвиджа. Правило Гурвица. Анализ связанной группы решений в условиях частичной неопределенности. Оптимальность по Парето при учете двух характеристик финансовой операции. Правило Лапласа равновозможности .

2.1. Матрицы последствий и матрицы рисков

Понятие риска предполагает наличие рискующего; будем называть его Лицом, Принимающим Решения (ЛПР).

Допустим, рассматривается вопрос о проведении финансовой операции в условиях неопределенности. При этом у ЛПР есть несколько возможных решений i = 1,2,...,т, а реальная ситуация неопределенна и может принимать один из вариантов j = 1,2,..., n . Пусть известно, что если ЛПР примет i- e решение, а ситуация примет j- ый вариант, то будет получен доход q ij . Матрица Q = (q ij) называется матрицей последствий (возможных решений) 4 .

Оценим размеры риска в данной схеме.

Пусть принимается i- е решение. Очевидно, если бы было известно, что реальная ситуация будет j -я, то ЛПР принял бы решение, дающее доход q j = . Однако, i- е решение принимается в условиях неопределенности. Значит, ЛПР рискует получить не q j , а только q ij . Таким образом, существует реальная возможность недополучить доход, и этому неблагоприятному исходу можно сопоставить риск r ij , размер которого целесообразно оценить как разность

r ij = q j - q ij . (2.1)

Матрица R = (r ij ) называется матрицей рисков 5 .

Пример 2.1. Используя формулу (2.1), составьте матрицу рисков

R = (r ij ) по заданной матрице последствий

Решение . Очевидно, q 1 = = 8; аналогично q 2 = 5, q 3 = 8, q 4 = 12 . Следовательно, матрица рисков имеет вид

2.2. Анализ связанной группы решений в условиях полной

неопределенности

Полная неопределенность означает отсутствие информации о вероятностных состояниях среды (“природы”), например, о вероятностях тех или иных вариантов реальной ситуации; в лучшем случае известны диапазоны значений рассматриваемых величин. Рекомендации по принятию решений в таких ситуациях сформулированы в виде определенных правил (критериев). Рассмотрим основные из них.

Критерий (правило) максимакса. По этому критерию определяется вариант решения, максимизирующий максимальные выигрыши - например, доходы – для каждого варианта ситуации. Это критерий крайнего (“розового”) оптимизма , по которому наилучшим является решение, дающее максимальный выигрыш, равный. Рассматривая i- е решение, предполагают самую хорошую ситуацию, приносящую доход, а затем выбирают решение с наибольшим a i .

Пример 2.2. Для матрицы последствий в примере 2.1 выбрать вариант решения по критерию максимакса.

Решение. Находим последовательность значений: a 1 =8, a 2 =12, a 3 =10, a 4 =8. Из этих значение находим наибольшее: a 2 =12 . Следовательно, критерий максимакса рекомендует принять второе решение (i=2 ).

Правило Вальда (правило максимина, или критерий крайнего пессимизма). Рассматривая i-e решение, будем полагать, что на самом деле ситуация складывается самая плохая, т.е. приносящая самый малый доход: b i = min q ij . Но теперь выберем решение i 0 с наибольшим. Итак, правило Вальда рекомендует принять решение i 0 такое, что = = .

Пример 2.3. Для матрицы последствий в примере 2.1 выбрать вариант решения по критерию Вальда.

Решение. В примере 2.1 имеем b 1 = 2, b 2 = 2, b 3 = 3, b 4 = 1. Теперь из этих значений выбираем максимальное b 3 = 3. Значит, правило Вальда рекомендует принять 3-е решение (i=3 ).

Правило Сэвиджа (критерий минимаксного риска). Этот критерий аналогичен предыдущему критерию Вальда, но ЛПР принимает решение, руководствуясь не матрицей последствий Q, а матрицей рисков R = (r ij). По этому критерию лучшим является решение, при котором максимальное значение риска будет наименьшим, т.е. равным. Рассматривая i-e решение, предполагают ситуацию максимального риска r i = и выбирают вариант решения i 0 с наименьшим = = .

Пример 2.4. Для исходных данных в примере 2.1 выбрать вариант решения в соответствии с критерием Сэвиджа.

Решение . Рассматривая матрицу рисков R, находим последовательность величин r i = : r 1 = 8, r 2 = 6, r 3 = 5, r 4 = 7. Из этих величин выбираем наименьшую: r 3 = 5. Значит, правило Сэвиджа рекомендует принять 3-е решение (i=3 ). Заметит, что это совпадает с выбором по критерию Вальда.

Правило Гурвица (взвешивающее пессимистический и оптимистический подходы к ситуации). По данному критерию выбирается вариант решения, при котором достигается максимум выражения c i = {λminq ij + (1 – λ)maxq ij }, где 0 λ 1. Таким образом, этот критерий рекомендует руководствоваться некоторым средним результатом между крайним оптимизмом и крайним пессимизмом . При λ=0 критерий Гурвица совпадает с максимаксным критерием, а при λ=1 он совпадает с критерием Вальда. Значение λ выбирается из субъективных (интуитивных) соображений.

Пример 2.5. Для приведенной в примере 2.1 матрицы последствий выбрать наилучший вариант решения на основе критерия Гурвица при λ =1/2.

Решение. Рассматривая матрицу последствий Q по строкам, для каждого i вычисляем значения c i = 1/2minq ij + 1/2maxq ij . Например, с 1 =1/2 * 2+1/2 * 8=5; аналогично находятся с 2 =7; с 3 =6,5; с 4 = 4,5. Наибольшим является с 2 =7. Следовательно, критерий Гурвица при заданном λ =1/2 рекомендует выбрать второй вариант (i=2 ).

2.3. Анализ связанной группы решений в условиях частичной

неопределенности

Если при принятии решения ЛПР известны вероятности p j того, что реальная ситуация может развиваться по варианту j, то говорят, что ЛПР находится в условиях частичной неопределенности. В этом случае можно руководствоваться одним из следующих критериев (правил).

Критерий (правило) максимизации среднего ожидаемого дохода . Этот критерий называется также критерием максимума среднего выигрыша. Если известны вероятности p j вариантов развития реальной ситуации, то доход, получаемый при i-ом решении, является случайной величиной Q i с рядом распределения

    q i1 q i2 q in
    p 1 p 2 p n

Математическое ожидание M [Q i ] случайной величины Q i и есть средний ожидаемый доход, обозначаемый также:

= M [Q i ] = .

Для каждого i-го варианта решения рассчитываются величины, и в соответствии с рассматриваемым критерием выбирается вариант, для которого достигается

Пример 2.6. Пусть для исходных данных примера 2.1 известны вероятности развития реальной ситуации по каждому из четырех вариантов, образующих полную группу событий:

p 1 =1/2, p 2 =1/6, p 3 =1/6, p 4 =1/6. Выяснить, при каком варианте решения достигается наибольший средний доход и какова величина этого дохода.

Решение. Найдем для каждого i-го варианта решения средний ожидаемый доход: =1/2*5+1/6*2+1/6*8+1/6*4= 29/6, = 25/6, = 7, = 17/6. Максимальный средний ожидаемый доход равен 7 и соответствует третьему решению.

Правило минимизации среднего ожидаемого риска (другое название –критерий минимума среднего проигрыша ).

В тех же условиях, что и в предыдущем случае, риск ЛПР при выборе i-го решения является случайной величиной R i с рядом распределения

    r i1 r i2 r in
    p 1 p 2 p n

Математическое ожидание M и есть средний ожидаемый риск, обозначаемый также: = M = . . Правило рекомендует принять решение, влекущее минимальный средний ожидаемыйриск: .

Пример 2.7 . Исходные данные те же, что и в примере 2.6. Определить, при каком варианте решения достигается наименьший средний ожидаемый риск, и найти величину минимального среднего ожидаемого риска (проигрыша).

Решение. Для каждого i-го варианта решения найдем величину среднего ожидаемого риска. На основе заданной матрицы риска R найдем: = 1/2*3+1/6*3+1/6*0+1/6*8=20/6, = 4, = 7/6, = 32/6.

Следовательно, минимальный средний ожидаемый риск равен 7/6 и соответствует третьему решению: = 7/6.

Замечание . Когда говорят о среднем ожидаемом доходе (выигрыше) или о среднем ожидаемом риске (проигрыше), то подразумевают возможность многократного повторения процесса принятия решения по описанной схеме или фактическое неоднократное повторение такого процесса в прошлом. Условность данного предположения заключается в том, что реально требуемого количества таких повторений может и не быть.

Критерий (правило) Лаплпаса равновозможности (безразличия) . Этот критерий непосредственно не относится к случаю частичной неопределеннос-ти, и его применяют в условиях полной неопределенности. Однако здесь предполагается, что все состояния среды (все варианты реальной ситуации) равновероятны – отсюда и название критерия. Тогда описанные выше схемы расчета можно применить, считая вероятности p j одинаковыми для всех вариантов реальной ситуации и равными 1/n. Так, при использовании критерия максимизации среднего ожидаемого дохода выбирается решение, при котором достигается. А в соответсвии с критерием минимизации среднего ожидаемого риска выбирается вариант решения, для которого обеспечивается .

Краткое описание

В условиях рыночных отношений большинство управленческих решений принимается в условиях риска. Это связано с отсутствием полной информации, наличием противоборствующих тенденций, элементами случайности и т.д. Таким образом, проблема оценки и учета экономического риска приобретает самостоятельное значение как часть теории и практики управления.

Содержание работы

ТЕМА 1. РИСК КАК ЭКОНОМИЧЕСКАЯ КАТЕГОРИЯ, ЕГО СУЩНОСТЬ 3
1.1. ПОНЯТИЕ РИСКА 3
1.2. ПРИЧИНЫ ВОЗНИКНОВЕНИЯ ЭКОНОМИЧЕСКОГО РИСКА 4
1.3. КЛАССИФИКАЦИЯ РИСКОВ 5
1.4. УПРАВЛЕНИЕ РИСКОМ 9
ТЕМА 2. КОЛИЧЕСТВЕННЫЕ ХАРАКТЕРИСТИКИ И СХЕМЫ ОЦЕНКИ РИСКОВ В УСЛОВИЯХ НЕОПРЕДЕЛЕННОСТИ. 12
2.1. МАТРИЦЫ ПОСЛЕДСТВИЙ И МАТРИЦЫ РИСКОВ 12
2.2. АНАЛИЗ СВЯЗАННОЙ ГРУППЫ РЕШЕНИЙ В УСЛОВИЯХ ПОЛНОЙ 13
НЕОПРЕДЕЛЕННОСТИ 13
2.3. АНАЛИЗ СВЯЗАННОЙ ГРУППЫ РЕШЕНИЙ В УСЛОВИЯХ ЧАСТИЧНОЙ 14
НЕОПРЕДЕЛЕННОСТИ 14
2.4. ОПТИМАЛЬНОСТЬ ПО ПАРЕТО ДВУХКРИТЕРИАЛЬНЫХ ФИНАНСОВЫХ 16
ОПЕРАЦИЙ В УСЛОВИЯХ НЕОПРЕДЕЛЕННОСТИ 16
ТЕМА 3. ИЗМЕРИТЕЛИ И ПОКАЗАТЕЛИ ФИНАНСОВЫХ РИСКОВ 18
3.1. ОБЩЕМЕТОДИЧЕСКИЕ ПОДХОДЫ К КОЛИЧЕСТВЕННОЙ ОЦЕНКЕ РИСКА 18
3.2. РАСПРЕДЕЛЕНИЯ ВЕРОЯТНОСТЕЙ И ОЖИДАЕМАЯ ДОХОДНОСТЬ 19
СОСТОЯНИЕ 19
3.3. КОМБИНАЦИИ ОЖИДАЕМОГО ЗНАЧЕНИЯ И ДИСПЕРСИИ КАК КРИТЕРИЙ РИСКА 23
3.4. КОЭФФИЦИЕНТЫ РИСКА И КОЭФФИЦИЕНТЫ ПОКРЫТИЯ РИСКОВ 31
ТЕМА 4. ЗАДАЧИ ФОРМИРОВАНИЯ ПОРТФЕЛЕЙ ЦЕННЫХ БУМАГ. 32
4.1. ОСНОВНЫЕ ХАРАКТЕРИСТИКИ ПОРТФЕЛЯ ЦЕННЫХ БУМАГ. 32
4.2. ПОСТАНОВКА ЗАДАЧИ ОБ ОПТИМАЛЬНОМ ПОРТФЕЛЕ. 36
4.3. ФОРМИРОВАНИЕ ОПТИМАЛЬНОГО ПОРТФЕЛЯ С ПОМОЩЬЮ ВЕДУЩЕГО ФАКТОРА ФИНАНСОВОГО РЫНКА. 40
4.4 МНОГОФАКТОРНЫЕ МОДЕЛИ. ТЕОРИЯ АРБИТРАЖНОГО ЦЕНООБРАЗОВАНИЯ. 52
4.5 ПОЯСНЕНИЯ К РЕШЕНИЮ ЗАДАЧИ 1 СРЕДСТВАМИ EXCEL ЗАДАЧА МАРКОВИЦА О ФОРМИРОВАНИИ ПОРТФЕЛЯ ЗАДАННОЙ ДОХОДНОСТИ С УЧЕТОМ ВЕДУЩЕГО ФАКТОРА. 54
ЗАДАНИЯ ДЛЯ АУДИТОРНОЙ РАБОТЫ С ПРИМЕНЕНИЕМ ПЭВМ. 64
СПИСОК ЛИТЕРАТУРЫ 65