Критерии оптимальности в условиях полной неопределенности

Неопределенность, связанную с отсутствием информации о вероятностях состояний среды (природы), называют «безнадежной» или «дурной».

В таких случаях для определения наилучших решений используются следующие критерии:

  • • критерий гарантированного результата (максиминный критерий Вальда) - это пессимистический по своей сути критерий, потому что принимается во внимание только самый плохой из всех возможных результатов каждой альтернативы. Этот подход устанавливает гарантированный минимум, хотя фактический результат может и не быть настолько плохим;
  • • критерий оптимизма (критерий максимакса) соответствует оптимистической наступательной стратегии; здесь не принимается во внимание никакой возможный результат, кроме самого лучшего;
  • • критерий пессимизма характеризуется выбором худшей альтернативы с худшим из всех худших значений окупаемости;
  • • критерий минимаксного риска Сэвиджа можно рассматривать как критерий наименьшего вреда, который определяет худшие возможные последствия для каждой альтернативы и выбирает альтернативу с лучшим из плохих значений;
  • • критерий обобщенного максимина (пессимизма - оптимизма) Гурвица позволяет учитывать состояние между крайним пессимизмом и безудержным оптимизмом. В определенных обстоятельствах каждый из этих методов имеет свои достоинства и недостатки, которые могут помочь в выработке решения.

При сравнительном анализе критериев эффективности нецелесообразно останавливаться на выборе единственного критерия, так как в ряде случаев это может привести к неоправданным решениям. ведущим к значительным потерям экономического, социального и иного содержания. Поэтому в указанных ситуациях имеется необходимость применения нескольких критериев в совокупности. Например, наряду с критерием гарантированного результата может быть использован критерий Сэвиджа, критерий оптимального поведения может дополняться применением пессимистического критерия и т.д.

Применение различных критериев эффективности для различных задач выбора оптимальных решений в условиях неопределенности показывает, что подход, базирующийся на комплексном применении указанных критериев, может стать определяющим.

Изложение начнем с критерия гарантированного результата. Его также называют максиминным критерием Вальда. Сущность данного критерия заключается в следующем. ЛПР располагает множеством стратегий (вариантов, альтернатив) решения проблемы: />={/>}, / =1,/» .

Указанные стратегии считаются контролируемыми (управляемыми) факторами. Наряду с управляемыми факторами действуют факторы, которые не поддаются контролю. Обозначим их

через П ={я }, j =,п.

В качестве Р, могут быть: технические параметры проектируемых систем, экономические показатели состояния предприятия, различные варианты решения поставленных задач и т.п.

Факторы Я/ представляют: уровень спроса на товары, предлагаемые фирмой, рыночные цены, условия эксплуатации технических и производственных систем, действия конкурентов и т.д.

Для оценки эффективности принимаемых решений вводим показатель эффективности Е и считаем, что функция Е(Р, Я) является известной. Так как факторы Р и Я, по предположению, дискретные, то и эффективность Е также представляет собой множество дискретных чисел. Таким образом, каждой точке контролируемых и неконтролируемых факторов (Р,, Я,) ставится в соответствие значение эффективности E(Ph Я,). Следовательно, можно построить матрицу Е которая представлена в виде табл. 1.1.

Таблица 1.1

Матрица эффективности

Pi

я.

П2

п«

mine,.

j J

Р

е„

е(Р, Я)ш1п

Р2

е2

в 22

е(Р2, //)min

Рт

ет

е„й

®/ИЛ

е(Р„„ //)min

Для каждого контролируемого фактора Р, (строки) находится min е(Р;,Я,), в результате чего определяется набор значений

ISJS1

показателя эффективности с(Рь Щтт, е(Р2. П)тт, е(Р„„ П)тт. Сравнивая полученные величины, выбирают управляемый фактор Р[ Е Р. при котором обеспечивается максимальное значение Е(Р. П).

Таким образом, критерий гарантированного результата (мак- симинный критерий Вальда) записывается в виде

Данный критерий обеспечивает максимизацию минимального выигрыша или. что то же самое, минимизацию максимальных потерь, которые могут быть при реализации одной из стратегий. Критерий прост и четок, но консервативен в том смысле, что ориентирует принимающего решение на слишком осторожную линию поведения. Величина, соответствующая максимальному критерию, называется нижней ценой игры, под которой следует понимать максимальный выигрыш, гарантируемый в игре с данным противником выбором одной из своих стратегий при минимальных результатах. Это перестраховочная позиция крайнего пессимизма, рассчитанная на худший случай. Такая стратегия приемлема, например, когда игрок не столь заинтересован в крупной удаче, но хочет себя застраховать от неожиданных проигрышей. Выбор такой стратегии определяется отношением игрока к риску.

В ряде экономических задач в качестве критерия эффективности принимаемых решений выступает показатель минимума затрат. В этих ситуациях принцип гарантированных затрат формулируется в виде

В качестве затрат 3 =|Я>| могут выступать: капитальные вложения, валовые издержки производства, приведенные годовые затраты и другие показатели.

При использовании критерия оптимизма, называемого также критерием максимакса, ЛПР ориентируется на то, что условия функционирования анализируемых систем будут для него наиболее благоприятными. Вследствие этого оптимальным решением является стратегия, приводящая к получению наибольшего значения критерия оптимальности в платежной матрице. Этот критерий целесообразно применять в тех случаях, когда имеется принципиальная возможность повлиять на функции противоположной стороны.

Если анализируется матрица эффекта Е(Р. П) того или иного вида, то выбор управляемых факторов осуществляется таким образом, чтобы обеспечить максимум эффекта. И в этом случае критерий оптимизма записывается в виде

Если рассматривается матрица затрат, то управляемые факторы выбираются так, чтобы минимизировать указанные затраты. Тогда рассматриваемый критерий формируется следующим образом

Отметим, что ситуации, требующие применения критерия оптимизма, в экономике в общем нередки и пользуются им не только безоглядные оптимисты, но и игроки, поставленные в безвыходное положение, когда они вынуждены руководствоваться принципом «или пан, или пропал».

В отличие от критерия оптимизма, когда ЛПР ориентируется на наиболее благоприятную внешнюю среду, которая является неконтролируемой, и на оптимальное использование управляемых факторов, при использовании принципа пессимизма предполагается, что управляемые факторы могут быть использованы неблагоприятным образом

где Е(Р. П) - функция эффективности принимаемых решений.

Применение этого принципа может вызывать некоторое сомнение, если учесть, что факторы Р являются контролируемыми и их следует использовать оптимальным в том или ином смысле образом. Однако, в реальных ситуациях в ряде задач может оказаться невозможным контролировать факторы, принадлежащие множеству Р. Особенно это относится к задачам, связанным с необходимостью учета фактора времени.

К этим задачам можно отнести следующие: социально-экономическое прогнозирование; долгосрочное планирование; проектирование сложных объектов и др.

Например, издержки производства являются контролируемыми факторами на коротких временных интервалах. Однако, при анализе длительных процессов, которые составляют несколько лет, некоторые элементы указанных издержек становятся неконтролируемыми. К таким элементам можно отнести: стоимость электроэнергии, стоимость материалов и покупных изделий и т.п.

Другим примером является определение объемов производства продукции предприятия. Данный показатель также можно считать управляемым фактором. Но он зависит от различных факторов, которые могут существенным образом применяться в процессе производства. При этом указанные факторы относятся к внутренней среде предприятия: уровень конструкторской и технологической подготовки производства, тип используемого оборудования, квалификация работающих и пр.

Для анализа матрицы затрат критерий пессимизма запишется как

При использовании вышеперечисленных критериев возможны ситуации, когда неконтролируемые факторы будут действовать более благоприятным образом по сравнению с наихудшим состоянием, на которое ориентировалось ЛПР. Например, погодные условия оказываются более благоприятными по сравнению с прогнозируемыми. Количество конкурентов на тех или иных рынках оказывается существенно меньше по сравнению с теми ожиданиями, на которые ориентировались производители.

В подобных ситуациях полезный результат может значительно отличаться от того, который обеспечивается при реализации критерия гарантированного результата или критерия пессимизма.

Поэтому возникает необходимость определения возможных отклонений полученных результатов от их оптимальных значений. Здесь находит применение критерий Сэвиджа. Выбор стратегии аналогичен выбору стратегии по принципу Вальда с тем отличием, что игрок руководствуется не матрицей выигрышей Е, а матрицей рисков R. построенной по формуле (1.2.2).

Критерий Сэвиджа формулируется следующим образом

Сущность этого критерия в стремлении избежать большого риска при выборе решения. Таким образом, критерий Сэвиджа минимизирует возможные потери. Основным исходным допущением этого критерия является предположение о том, что на наступление вариантов обстановки оказывают влияние действия разумных противников (природы), интересы которых прямо противоположны интересам ЛПР. Поэтому, если у противников (конкурентов) имеется возможность извлечь какие-либо преимущества, то они это обязательно сделают. Это обстоятельство заставляет ЛПР обеспечить минимизацию потерь вследствие этих действий.

Критерий обобщенного максимина (пессимизма-оптимизма) Гурвица позволяет учитывать комбинации наихудших состояний. Этот критерий при выборе решения рекомендует руководствоваться некоторым средним результатом, характеризующим состояние между крайним пессимизмом и безудержным оптимизмом.

В соответствии с этим компромиссным критерием для каждого решения определяется линейная комбинация минимального и

максимального выигрышей ? ={Armine,, +(1 -/с)шахе,,}, и предка) J is/» J

почтение отдается варианту решения, для которого окажется максимальным показатель ?„ т.е.

где к - коэффициент, рассматриваемый как показатель оптимизма (0 < 1).

При к - 0 критерий Гурвица совпадает с максимальным критерием, т.е. ориентация на предельный риск, так как больший выигрыш сопряжен, как правило, с большим риском. При к = 1 - ориентация на осторожное поведение. Значения к между 0 и 1 являются промежуточными между риском и осторожностью и выбираются в зависимости от конкретной обстановки и склонности к риску ЛПР.

Применительно к матрице рисков R критерий Гурвица имеет вид

Сведем все критерии оптимальности в табл. 1.2.

Таблица 1.2

Таблица коэффициентов оптимальности

Показатель

Формула

Название

Наибольшая

осторожность

Критерий гарантированного результата (Вальда)

Наименьшая

осторожность

Критерий оптимизма

Крайняя

осторожность

Критерий пессимизма

Минимальный

риск

Критерий Сэвиджа

Компромисс в решении

Критерий Гурвица

Критерий Гурвица относительно матрицы рисков

 
Посмотреть оригинал
< Пред   СОДЕРЖАНИЕ ОРИГИНАЛ   След >