Определение платежной матрицы. Платежная матрица

17.03.2019

Использование метода платежной матрицы в производственном менеджменте

1. Метод платежной матрицы

Хотя некоторые модели, используемые в производственном менеджменте, настолько сложны, что без компьютера обойтись невозможно, концепция моделирования проста.

По определению Шеннона: «МОДЕЛЬ - это представление объекта, системы или идеи в некоторой форме, отличной от самой целостности». Схема организации, к примеру, это и есть модель, представляющая ее структуру.

Главной характеристикой модели можно считать упрощение реальной жизненной ситуации, к которой она применяется. Поскольку форма модели менее сложна, а не относящиеся к делу данные, затуманивающие проблему в реальной жизни, устраняются, модель зачастую повышает способность руководителя к пониманию и разрешению встающих перед ним проблем.

Число всевозможных конкретных моделей науки управления почти так же велико, как и число проблем, для разрешения которых они были разработаны.

Практически любой метод принятия решений, используемый в управлении, можно технически рассматривать как разновидность моделирования. В дополнение к моделированию, имеется ряд методов, способных оказать помощь руководителю в поиске объективно обоснованного решения по выбору из нескольких альтернатив той, которая в наибольшей мере способствует достижению целей. К таким относится Платежная матрица.

Суть каждого принимаемого руководством решения - выбор наилучшей из нескольких альтернатив по конкретным установленным заранее критериям.

Платежная матрица - это один из методов статистической теории решений, метод, который может оказать помощь руководителю в выборе одного из нескольких вариантов. Он особенно полезен, когда руководитель должен установить, какая стратегия в наибольшей мере будет способствовать достижению целей.

По словам Н. Пола Лумбы: «Платеж представляет собой денежное вознаграждение или полезность, являющиеся следствием конкретной стратегии в сочетании с конкретными обстоятельствами. Если платежи представить в форме таблицы (или матрицы), мы получаем платежную матрицу», как показано в таблице 1.

В самом общем виде матрица означает, что платеж зависит от определенных событий, которые фактически свершаются. Если такое событие или состояние природы не случается на деле, платеж неизбежно будет иным Мескон Майкл, Альберт Майкл, Хедоури Франклин. Основы менеджмента./ Перевод с английского. - М.:Издательство «Дело», 1997. - http://www.tourlib.columb.net.ua/Lib/meskon.htm .

Таблица 1. Платежная матрица

В целом платежная матрица полезна, когда:

1. Имеется разумно ограниченное число альтернатив или вариантов стратегии для выбора между ними.

2. То, что может случиться, с полной определенностью не известно.

3. Результаты принятого решения зависят от того, какая именно выбрана альтернатива и какие события в действительности имеют место.

Кроме того, руководитель должен располагать возможностью объективной оценки вероятности релевантных событий и расчета ожидаемого значения такой вероятности. Руководитель редко имеет полную определенность. Но также редко он действует в условиях полной неопределенности. Почти во всех случаях принятия решений руководителю приходится оценивать вероятность или возможность события. Из предшествующего рассмотрения напомним, что вероятность варьирует от 1, когда событие определенно произойдет, до 0, когда событие определенно не произойдет. Вероятность можно определить объективно, как поступает игрок в рулетку, ставя на нечетные номера. Выбор ее значения может опираться на прошлые тенденции или субъективную оценку руководителя, который исходит из собственного опыта действий в подобных ситуациях.

Если вероятность не была принята в расчет, решение всегда будет соскальзывать в направлении наиболее оптимистических последствий.

Например, если исходить из того, что инвесторы на удачной кинокартине могут иметь 500% на инвестированный капитал, а при вложении в торговую сеть - в самом благоприятном варианте всего 20%, то решение всегда должно быть в пользу кинопроизводства. Однако если взять в расчет, что вероятность большого успеха кинофильма весьма невысока, капиталовложения в магазины становятся более привлекательными, поскольку вероятность получения указанных 20% очень значительна. Если взять более простой пример, то выплаты при ставках в заезде на длинную дистанцию на скачках выше, поскольку выше вероятность, что не выиграешь вообще ничего Мескон Майкл, Альберт Майкл, Хедоури Франклин. Основы менеджмента./ Перевод с английского. - М.:Издательство «Дело», 1997. - http://www.tourlib.columb.net.ua/Lib/meskon.htm .

Вероятность прямо влияет на определение ожидаемого значения - центральной концепции платежной матрицы. Ожидаемое значение альтернативы или варианта стратегии - это сумма возможных значений, умноженных на соответствующие вероятности.

Определив ожидаемое значение каждой альтернативы и расположив результаты в виде матрицы, руководитель без труда может установить, какой выбор наиболее привлекателен при заданных критериях. Он будет, конечно, соответствовать наивысшему ожидаемому значению (Таблица 2).

На основе платежной матрицы З = ||З ji || рассчитывается матрица рисков - =|| ji || . При этом риск ji для варианта деятельности x j и сочетания исходных данных определяется по формуле

Таблица 2. Платежная матрица З = ||З ji ||

Варианты деятельности

Сочетания исходных данных

Платежная матрица рисков служит информационной основой для сопоставления и выбора окончательного (предпочтительного) с точки зрения оптимальности варианта деятельности. Для осуществления такого выбора используются специальные правила принятия решения в условиях неопределенности и риска. К числу таких правил относятся:

1. Критерий Лапласа (минимумы среднеарифметических затрат З j).

2. Критерий Вальда (минимальных затрат или максимальной полезности).

3. Критерий Сэвиджа (минимального риска).

4. Критерий Гурвица.

1. Критерий Лапласа. По принципу недостаточного основания в условиях, когда невозможно выяснить вероятности для возникновения того или иного состояния внешней среды, им сопоставляют равные вероятности, находят средний эффект для каждого из рассматриваемых вариантов решения и выбирается тот из них, где средний эффект максимален:

2. Критерий Вальда (критерий наибольшей осторожности/ пессимиста). Для каждого из рассматриваемых вариантов решения Xi выбирается самая худшая ситуация (наименьшее из Wij) и среди них отыскивается гарантированный максимальный эффект:

3. Критерий Гурвица. Ориентация на самый худший исход является своеобразной перестраховкой, однако опрометчиво выбирать и излишне оптимистичную политику. Критерий Гурвица предлагает некоторый компромисс:

где параметр б принимает значение от 0 до 1 и выступает как коэффициент оптимизма.

К примеру, при б =0 (полный пессимизм) критерий Гурвица превращается в критерий Вальда, при б =0.5 расценивают равновероятно шансы на успех и неудачу, при б =0.2 - более осторожны и вероятность успеха считают меньшей (0.2), чем возможную неудачу.

4. Критерий Сэвиджа. Суть его - нахождение минимального риска. При выборе решения по этому критерию:

Dij = Wij- (Wij)

· матрице функции полезности (эффективности) сопоставляется новая матрица - матрица сожалений, элементы которой отражают убытки от ошибочного действия, т.е. выгоду, упущенную в результате принятия i>-го решения в j-м состоянии;

· по матрице D выбирается решение по пессимистическому критерию Вальда, дающее наименьшее значение максимального сожаления

Вполне логично, что различные критерии приводят к различным выводам относительно наилучшего решения. Вместе с тем возможность выбора критерия дает свободу менеджерам, принимающим управленческие решения.

Любой критерий должен согласовываться с намерениями решающего задачу и соответствовать его характеру, знаниям и убеждениям М.А.Тынкевич. Экономико-математические методы (исследование операций). - Кемерово: КузГТУ, 2000. .

Имеются и другие обобщенные критерии, являющиеся по существу комбинациями выше перечисленных критериев). Однако ни один из них не свободен от условностей и не обеспечивает однозначного выбора варианта деятельности. Поэтому окончательный выбор варианта - задача экспертов и специалистов.

Выбор и реализация стратегии на примере кулинарного производства СМ "Элит Центр" ТС Rainford

Для СХЕ фирмы эти показатели соответственно: СХЕ 1 - 19% и 0,8 СХЕ 2 - 30% и 1,8 СХЕ 3 - 13,5% и1,5 СХЕ 4 - 10% и 0 Матрица роста доли рынка кулинарного отдела СМ «Элит Центр» Анализируя матрицу можно определить...

Использование метода платежной матрицы в производственном менеджменте

В Самаре решено открыть яхт-клуб. Необходимо определить, сколько следует закупить яхт (из расчета: одна яхта на 5 человек), если предполагаемое число членов клуба колеблется от 10 до 25 человек. Годовой абонемент стоит 100 денежных единиц...

Кадровые риски

Возможность прямой количественной оценки риска без непосредственного вычисления вероятностей событий реализована в широко известном методе оценки рисков на основе матрицы «вероятность-ущерб». Сущность метода заключается в том...

Методы проведения экспертиз при разработке управленческих решений

В составе экспертных методов, наиболее активно используемых в настоящее время при выборе вариантов решений, наиболее известны метод «Дельфи» и метод мозговой атаки. Метод «Дельфи» разработан и применен в США впервые в 1964 г...

Модифицированная матрица Бостонской консультативной группы

Прибыли, полученные от эксплуатации "дойных коров", утверждали в BCG, следует использовать на финансирование развития потенциально выгодных, но убыточных в связи с небольшими объемами выпуска, "знаков вопроса"...

Повышение эффективности системы стратегического менеджмента на предприятии ИП Зайнуллин с применением ADL матрицы

Матрица ADL была разработана известной в области управления консалтинговой компанией Артур Д. Литл. Матрица ADL -- это многофакторная модель для стратегического анализа диверсифицированных компаний...

ѕ Метод предельных и номинальных значений (метод статистической обработки проектов или вероятностный метод). ѕ Метод эквивалентных соотношений...

Показатели качества разнородной продукции

Основу метода стоимостных регрессионных зависимостей составляет посылка, что весомость Mi является монотонно возрастающей функцией аргумента Si, выражающего денежные или трудовые затраты...

Профессионализм менеджера

Метод аналогий всегда был важным эвристическим методом решения творческих задач. Процесс применения аналогии является как бы промежуточным звеном между интуитивными и логическими процедурами мышления...

Разработка методики комплексной оценки изделий специального назначения в процессе инновационной деятельности

Рассмотрим совокупность элементов некоторого уровня иерархии. Необходимо определить степени влияния (веса) этих элементов на некоторый элемент более высокого уровня. Построим матрицу парных сравнений по степени их влияния...

Роль портфельного анализа в формировании стратегии предприятия

Наиболее распространенным методами портфельного анализа являются матричные методы. Матрицы для портфельного анализа обычно являются двумерными таблицами...

На протяжении оцениваемого периода ведутся записи поведения каждого работника, в этих записях фиксируются примеры успешного и неудачного поведения в критических ситуациях...

Совершенствование оценки персонала на примере МУП "Иркутскгорэлектротранс"

Аналогичен предыдущему, но вместо определения поведения работников в решающей ситуации текущего времени оценщик фиксирует на шкале количество случаев, когда работник вел себя тем или иным специфическим способом ранее...

Управление инвестиционной деятельностью ОАО "Арсеньевский мясокомбинат"

После определения основных факторов внешней среды необходимо произвести их распределение с целью построения матрицы возможностей и матрицы угроз (рис.3). Под возможностями организации понимают положительные тенденции и явления внешней среды...

Практически любой метод принятия решений , используемый в управлении, можно технически рассматривать как разновидность моделирования. Однако по традиции термин модель обычно относится лишь к методам общего характера, только что описанным выше, а также к многочисленным их специфическим разновидностям. В дополнение к моделированию, имеется ряд методов, способных оказать помощь руководителю в поиске объективно обоснованного решения по выбору из нескольких альтернатив той, которая в наибольшей мере способствует достижению целей. Под заголовок данного раздела попадают платежная матрица и дерево решений , описанные ниже. Для облегчения использования этих методов и вообще повышения качества принимаемых решений руководство пользуется прогнозированием. Наиболее распространенные методы прогнозирования рассмотрены в следующем разделе. Наша цель заключается в том, чтобы помочь понять суть этих инструментов, а не научить ими пользоваться.  


Суть каждого принимаемого руководством решения - выбор наилучшей из нескольких альтернатив по конкретным установленным заранее критериям. (Если вы захотите вспомнить рассмотрение ограничений и критериев для принятия решений , обратитесь к гл. 6). Платежная матрица - это один из методов статистической теории решений , метод, который может оказать помощь руководителю в выборе одного из нескольких вариантов. Он особенно полезен, когда руководитель должен установить, какая стратегия в наибольшей мере будет способствовать достижению целей.  

В целом платежная матрица полезна, когда  

Вероятность прямо влияет на определение ожидаемого значения - центральной концепции платежной матрицы. Ожидаемое значение альтернативы или варианта стратегии - это сумма возможных значений, умноженных на соответствующие вероятности. К примеру, если вы считаете, что вложение средств (как стратегия действий) в киоск для торговли мороженым с вероятностью 0,5 обеспечит вам годовую прибыль 5000 долл., с вероятностью 0,2 - 10 000 долл. и с вероятностью 0,3 - 3000 долл., то ожидаемое значение составит  

В табл. 12.2 сведены результаты различных возможных решений по ценообразованию. Решая, какую цену установить, две фирмы играют в некооперативную игру - каждая фирма самостоятельно решает, как ей лучше поступить, принимая в расчет своего конкурента. Табл. 12.2 называют платежной матрицей для этой игры, так как она показывает прибыль каждой фирмы, если известны ее решение и решение ее конкурента. Например, верхний левый угол платежной матрицы говорит нам, что, если обе фирмы назначат цену 4 долл., каждая фирма получит прибыль 12 долл. Верхний правый угол показывает, что, если фирма 1 назначает цену в 4 долл., а фирма 2 - в 6 долл., фирма 1 получает прибыль в 20 долл., а фирма 2 - в 4 долл.  

ТАБЛИЦА 12.2 Платежная матрица для игры по протезированию цен  

Данная платежная матрица может прояснить ответ на первоначальный вопрос почему фирмы не действуют сообща и тем самым не получают более высокие прибыли, даже если они и имеют возможность договориться В данном случае договор означает, что обе фирмы назначат цену в 6 долл. вместо 4 долл. и получат при этом прибыль 16 долл. вместо 12 долл. Проблема заключается в том, что каждая фирма всегда старается выиграть, назначая цену в 4 долл., независимо от того, как поступает ее конкурент. Как показывает платежная матрица,  

Рассматривая предприятие (Р,) и природу (Р2) в качестве двух игроков, получим так называемую платежную матрицу следующего вида (табл. 6.11)  

Из платежной матрицы видно, что игрок Р, (предприятие) никогда не получит дохода меньше 6800. Но если погодные условия совпадут с выбранной стратегией, то выручка (выигрыш) предприятия будет составлять 26000 или 28400. Если игрок Р, будет постоянно применять стратегию А, а игрок Р2 - стратегию Д, то выигрыш снизится до 6800. То же самое произойдет, если игрок Р, будет постоянно применять стратегию В, а игрок Р2 -- стратегию С. Отсюда вывод, что наибольший доход предприятие обеспечит, если будет попеременно применять то стратегию А, то стратегию В. Такая стратегия называется смешанной, а ее элементы (А и В) - чистыми стратегиями.  

Рассматривая АО Силуэт и природу в качестве двух игроков /, и Р2, получим по итогам произведенных расчетов так называемую платежную матрицу следующего вида (с. 53).  

По данным платежной матрицы игрок Р1 (АО Силуэт) никогда не получит прибыль меньше 136 000 руб. Если погодные условия совпадут с выбранной стратегией, то прибыль АО (выигрыш) будет составлять 568 000 или 520 000 руб. Если игрок Р будет постоянно принимать стратегию А, а игрок Р2 - стратегию Д, то прибыль снизится до 136 000 руб. То же самое будет, если игрок Р постоянно принимает стратегию В, а игрок Р2 - страте-  

Пример. Суточный спрос на скоропортящийся продукт в тоннах выражается следующим распределением (спрос/вероятность) (0,0/0,2) (1,0/0,3) (2,0/0,4) (3,0/0,5). Пусть себестоимость тонны - 3 тыс. руб., продажная цена - 5 тыс. руб., прибыль за единицу- 2 тыс. руб. Магазин может держать запас в 0, 1,2 или 3 т. Положим, что дневной запас не может быть продан завтра, и остатки целиком списываются в убытки. Платежная матрица показана в табл. 7.2. Анализ с полной информацией приведен в табл. 7.3.  

Пусть торговое предприятие имеет т стратегий Т, Т,. .., Т, и имеется п возможных состояний природы Ль П2,. .., Пп. Так как природа не является заинтересованной стороной, исход любого сочетания поведения сторон можно оценить выигрышем Ъц первой стороны для каждой пары стратегий Т, и TIj. Все показатели игры заданы платежной матрицей йу.  

Пример. Предприятие планирует производство двух изделий А, Б с неопределенным спросом , предполагаемый уровень которого характеризуется двумя состояниями I, П. В зависимости от этих состояний прибыль предприятия различна и определяется платежной матрицей  

Требуется определить объемы производства каждого изделия, при котором предприятию гарантируется средняя величина при любом состоянии спроса . Решение. Проверка платежной матрицы на наличие седловой точки  

Пусть задана платежная матрица игры  

Условие игры обычно записывается в форме платежной матрицы, или матрицы игры (табл. 3.33).  

Пусть платежная матрица задана в качественных терминах. Данные  

Анализ платежных матриц позволяет сделать следующие выводы при неполной информации наилучший выбор - держать запас в 2 т с наибольшим значением прибыли 1,90 тыс. руб. Это лучшее, что вы можете сделать при ограниченной информации.  

В практике управления широко используются такие методы, как платежная матрица дерево целей или решений. Наиболее известным из них является метод дерева решений для сравнения и оценки выдвинутых альтернатив. Особенно данный метод полезен в ситуациях, когда менеджер имеет дело с неопределенностью. Этот метод дает общую картину решения выборы , риски и исходы, которые могут иметь место. Более того, данный метод помогает открыть новые альтернативы, которые ранее могли быть опущены по каким-то причинам.  

Приведенные выше данные платежной матрицы отражают оценку последствий разных вариантов действий. Дополнительно представлены некоторые предположения относительно вероятности тумана который скажется на самолето, но не на поезде) и ясной погоды. Мы видим, что вероятность ясной погоды в 10 рлз выше, чем ту лана. Далее, матрица показывает, что, действуя по первому варианту стратегии (самолет), если погода будет хорошей (9 шансов из 10), торговый агент по оценке продаст товаров на 4500 долл. (это и есть результат или последствия). Три других варианта последствий можно объяснить таким же образом, мы опускаем эти рассуждения.  

По словам Н. Пола Лумбы Платеж представляет собой денежное вознаграждение или полезность, являющиеся следствием конкретной стратегии в сочетании с конкретными обстоятельствами. Если платежи представить в форме таблицы (или матрицы), мы получаем платежную матрицу 24, как показано на рис. 8.4. Слова в сочетании с конкретными обстоятельствами очень важны, чтобы понять, когда можно использовать платежную матрицу и оценить, когда решение, принятое на ее основе, скорее всего будет надежным. В самом общем виде матрица означает, что платеж зависит от определенных событий, которые фактически свершаются. Если такое событие или состояние природы не случается на деле, платеж неизбежно будет иным.  

Определив ожидаемое значение каждой альтернативы и расположив результаты в виде матрицы, руководитель без труда может установить, какой выбор наиболее привлекателен при заданных критериях. Он будет, конечно, соответствовать наивысшему ожидаемому значению. Исследования показывают когда установлены точные значения вероятности, методы дерева решений и платежной матрицы обеспечивают принятие более качественных решений, чем традиционные подходы25.   седловую точку ot = max minay = max (22,21,20) = 22 - нижняя цена  

Суждения о предпочтительности альтернатив выносится по результатам их сравнения или оценки. Г позитивные и негативные стороны каждой из альтернатив и устанавливается некий компромисс, поз] сопоставление альтернативы с ранее принятым стандартом, критерием. Для этого используют критериальное сравнение Кепнера -Трегое, платежная матрица, дерево целей или решений, а также i теориях вероятности , предпочтений, полезности и др. Наиболее распространенным методом сравне) является метод дерева решений , особенно в ситуациях неопределенных , при наличии неуправляемы  

ИГРА С "ПРИРОДОЙ" - игра, в которой имеется только один игрок, причем исход ее зависит не только от его решений, но и от состояния "природы", т.е. не от сознательно противодействующего противника, но от объективной, невраждебной действительности. Платежная матрица в этом случае похожа на показанную в ст. "Матрица игры ", но здесь игрок X - это лицо, принимающее одно из т различных возможных решений, а игрок Y- "природа", принимающая и возможных состояний. При выборе решения игроком X могут использоваться различные критерии, напр.  

Лекция 9. Понятие об игровых моделях. Платежная матрица.

§ 6 ЭЛЕМЕНТЫ ТЕОРИИ ИГР

6.1 Понятие об игровых моделях.

Математи­ческая модель конфликтной ситуации называется игрой , стороны, участвующие в конфликте, – игроками, а исход конфликта – выигрышем .

Для каждой формализованной игры вводятся правила , т.е. система условий, определяющая: 1) варианты действий игро­ков; 2) объем информации каждого игрока о поведении партне­ров; 3) выигрыш, к которому приводит каждая совокупность дей­ствий. Как правило, выигрыш (или проигрыш) может быть задан количественно; например, можно оценить проигрыш нулем, выигрыш – единицей, а ничью – 1/2. Количественная оценка результатов игры называется платежом .

Игра называется парной , если в ней участвуют два игрока, и множественной , если число игроков больше двух. Мы будем рас­сматривать только парные игры. В них участвуют два игрока А и В, интересы которых противоположны, а под игрой будем пони­мать ряд действий со стороны А и В.

Игра называется игрой с нулевой суммой, или антагонистиче­ ской , если выигрыш одного из игроков равен проигрышу другого, т.е. сумма выигрышей обеих сторон равна нулю. Для полного задания игры достаточно указать величину одно­го изних. Если обозначить а – выигрыш одного из игроков, b выигрыш другого, то для игры с нулевой суммой b = а , поэтому достаточно рассматривать, например а.

Выбор и осуществление одного из предусмотренных правила­ми действий называется ходом игрока. Ходы могут быть личными и случайными . Личный ход это сознательный выбор игроком одного из возможных действий (например, ход в шахматной игре). Набор возможных вариантов при каждом личном ходе регламентирован правилами игры и зависит от всей совокупности предшествующих ходов с обеих сторон.

Случайный ход это случайно выбранное действие (напри­мер, выбор карты из перетасованной колоды). Чтобы игра была математически определенной, правила игры должны для каждого случайного хода указывать рас­пределение вероятностей возможных исходов.

Некоторые игры могут состоять только из случайных ходов (так называемые чисто азартные игры) или только из личных ходов (шахматы, шашки). Большинство карточных игр принадлежит к играм смешанного типа, т. е. содержит как случайные, так и личные ходы. В дальнейшем мы будем рассматривать только личные ходы игроков.

Игры классифицируются не только по характеру ходов (личные, случайные), но и по характеру и по объему инфор­мации, доступной каждому игроку относительно действий другого. Особый класс игр составляют так называемые «игры с полной информацией». Игрой с полной информацией назы­вается игра, в которой каждый игрок при каждом личном ходе знает результаты всех предыдущих ходов,как личных, так и случайных. Примерами игр с полной информацией могут служить шахматы, шашки, а также известная игра «крестики и нолики». Большинство игр, имеющих практическое значение, не при­надлежит к классу игр с полной информацией, таккак неиз­вестность по поводу действий противника обычно является существенным элементом конфликтных ситуаций.

Одним из основных понятий теории игр является понятие стратегии .

Стратегией игрока называется совокупность правил, опреде­ляющих выбор его действия при каждом личном ходе в зависимо­сти от сложившейся ситуации. Обычно в процессе игры при каж­дом личном ходе игрок делает выбор в зависимости от конкрет­ной ситуации. Однако в принципе возможно, что все решения приняты игроком заранее (в ответ на любую сложившуюся ситуа­цию). Это означает, что игрок выбрал определенную стратегию, которая может быть задана в виде списка правил или программы. (Так можно осуществить игру с помощью ЭВМ). Игра называется конечной , если у каждого игрока имеется конечное число страте­гий, и бесконечной .– в противном случае.

Для того чтобы решить игру, или найти решение игры , следует для каждого игрока выбрать стратегию, которая удовле­творяет условию оптимальности , т.е. один из игроков должен по­лучать максимальный выигрыш, когда второй придерживается своей стратегии, В то же время второй игрок должен иметь минимальный проигрыш , если первый придерживается своей стратегии. Такие стратегии называются оптимальными . Оптимальные стратегии должны также удовлетворять условию устойчивости , т.е. любому из игроков должно быть невыгодно отказаться от своей стратегии в этой игре.

Если игра повторяется достаточно много раз, то игроков может интересовать не выигрыш и проигрыш в каждой конкретной пар­тии, а средний выигрыш (проигрыш) во всех партиях.

Целью теории игр является определение оптимальной стратегии для каждого игрока.

6.2. Платежная матрица. Нижняя и верхняя цена игры

Конечная игра, в которой игрок А имеет т стратегий, а игрок В – п стратегий, называется игрой .

Рассмотрим игру
двух игроковА и В («мы» и «противник»).

Пусть игрок А располагает т личными стратегиями, которые обозначим
. Пусть у игрокаВ имеется n личных стратегий, обозначим их
.

Пусть каждая сторона выбрала определенную стратегию; для нас это будет , для противника. В результате выбора игроками любой пары стратегийи(
) однозначно определяется исход игры, т.е. выигрышигрокаА (положительный или отрицательный) и проигрыш
игрокаВ.

Предположим, что значения известны для любой пары страте­гий (,). Матрица
,
, элементами которой являются выигрыши, соответствующие страте­гиям и , называется платежной матрицей или матрицей игры. Строки этой матрицы соот­ветствуют стратегиям игрока А, а столбцы – стратегиям игрока B . Эти стратегии называются чистыми.

Матрица игры
имеет вид:

Рассмотрим игру
с матрицей

и определим наилучшую среди стратегий
. Выбирая стратегию , игрок А должен рассчитывать, что игрок В ответит на нее той из стратегий , для которой выигрыш для иг­рока А минимален (игрок В стремится "навредить" игроку A ).

Обозначим через наименьший выигрыш игрокаА при вы­боре им стратегии для всех возможных стратегий игрокаВ (наименьшее число в i -й строке платежной матрицы), т.е.

(1)

Среди всех чисел (
) выберем наибольшее:
.

Назовем
нижней ценой нгры, или максимальным выигрышем (максмином). Это гарантированный выигрыш игрока А при любой стратегии игрока В. Следовательно,

. (2)

Стратегия, соответствующая максимину, называется максиминной стратегией . Игрок В заинтересован в том, чтобы уменьшить выигрыш игрока А, выбирая стратегию , он учитывает макси­мально возможный при этом выигрыш для А. Обозначим

. (3)

Среди всех чисел выберем наименьшее

и назо­вем верхней ценой игры илиминимаксным выигрышем (минимаксом). Эго гарантированный проигрыш игрока В . Следова­тельно,

. (4)

Стратегия, соответствующая минимаксу, называется минимаксной стратегией.

Принцип, диктующий игрокам выбор наиболее "осторожных" минимаксной и максиминной стратегий, называется принципом минимакса . Этот принцип следует из разумного предположения, что каждый игрок стремится достичь цели, противоположной цели противника.

Теорема. Нижняя цена игры всегда не превосходит верхней цены игры
.

Если верхняя и нижняя цены игры совпадают, то общее значе­ние верхней и нижней цены игры
называется чистой ценой игры, или ценой игры. Минимакс­ные стратегии, соответствующие цене игры, являются оптимальными стратегиями , а их совокупность – оптимальным решением или решением игры. В этом случае игрок А получает максимальный га­рантированный (не зависящий от поведения игрока В) выигрыш v , а игрок В добивается минимального гарантированного (вне зависи­мости от поведения игрока А) проигрыша v . Говорят, что решение игры обладает устойчивостью , т.е. если один из игроков придержи­вается своей оптимальной стратегии, то для другого не может быть выгодным отклоняться от своей оптимальной стратегии.

Если один из игроков (например А) придерживается своей оптимальной стратегии, а другой игрок (В) будет любым способом отклоняться от своей оптимальной стра­тегии, то для игрока, допустившего отклонение, это никогда не может оказаться выгодным; такое отклонение игрока В может в лучшем случае оставить выигрыш неизменным. а в худшем случае – увеличить его.

Наоборот, если В придерживается своей оптимальной стратегии, а А отклоняется от своей, то это ни в коем случае не может быть выгодным для А.

Пара чистых стратегий и дает оптимальное решение игры тогда и только тогда, когда соответствующий ей элемент явля­ется одновременно наибольшим в своем столбце и наименьшим в своей строке. Такая ситуация, если она существует, называется седловой точкой. В геометрии точку на поверхности, обладающую свойством: одновременный минимум по одной координате и максимум по другой, называют седловой точкой, по аналогии этот термин применяют в теории игр.

Игра, для которой
,
называется игрой с седловой точкой. Элемент , обладающий этим свойством, седловой точкой матрицы.

Итак, для каждой игры с седловой точкой существует решение, определяющее пару оптимальных стратегий обеих сторон, отличающуюся следующими свойствами.

1) Если обе стороны придерживаются своих оптимальных стратегий, то средний выигрыш равен чистой цене игры v , одновременно являющейся ее нижней и верхней ценой.

2) Если одна из сторон придерживается своей оптимальной стратегии, а другая отклоняется от своей, то от этого отклоняющаяся сторона может только потерять и ни в коем случае не может увеличить свой выигрыш.

Класс игр, имеющих седловую точку, представляет боль­шой интерес как с теоретической, так и с практической точки зрения.

В теории игр доказывается, что, в частности, каждая игра с полной информацией имеет седловую точку, и, сле­довательно, каждая такая игра имеет решение, т. е. суще­ствует пара оптимальных стратегий той и другой стороны, дающая средний выигрыш, равный цене игры. Если игра с полной информацией состоит только из личных ходов, то при применении каждой стороной своей оптимальной стратегии она должна всегда кончаться вполне определенным исходом, а именно, выигрышем, в точности равным цене игры.

Назначение сервиса . С помощью сервиса в онлайн режиме можно:
  • определить цену матричной игры (нижнюю и верхнюю границы), проверить наличие седловой точки, найти решение смешанной стратегии, найти минимаксную стратегию игроков;
  • записать математическую модель пары двойственных задач линейного программирования, решить матричную игру методами: минимакс, симплекс-метод , графический (геометрический) метод, методом Брауна .

Инструкция . Выберите размерность матрицы, нажмите Далее. В новом диалоговом окне выберите метод решения матричной игры. Пример заполнения . Результаты вычислений оформляются в отчете формата Word (см. пример оформления).

Размерность платежной матрицы 2 3 4 5 6 7 8 9 10 x 2 3 4 5 6 7 8 9 10
",0);">
Игра – это математическая модель реальной конфликтной ситуации. Конфликтная ситуация двух игроков называется парной игрой. Парную игру с нулевой суммой удобно исследовать, если она описана в виде матрицы. Такая игра называется матричной ; матрица, составленная из чисел a ij , называется платежной . В таблице представлены варианты решения игры, заданной платежной матрицей А.

Описание алгоритма:

  1. На основании анализа платёжной матрицы следует определить, существуют ли в ней доминируемые стратегии, и исключить их.
  2. Найти верхнюю и нижнюю цены игры и определить, имеет ли данная игра седловую точку (нижняя цена игры должна быть равна верхней цене игры).
  3. Если седловая точка существует, то оптимальными стратегиями игроков, являющимися решением игры, будут их чистые стратегии, соответствующие седловой точке. Цена игры равна верхней и нижней цены игры, которые равны между собой.
  4. Если игра не имеет седловой точки, то решение игры следует искать в смешанных стратегиях. Для определения оптимальных смешанных стратегий в играх m × n следует использовать симплекс-метод, предварительно переформулировав игровую задачу в задачу линейного программирования.

Представим алгоритм решения матричной игры графически.

Рисунок - Схема решения матричной игры.

Методы решения матричной игры в смешанных стратегиях

Итак, если седловая точка отсутствует, решение игры проводят в смешанных стратегиях и решают следующими методами:
  1. Решение игры через систему уравнений.
    Если задана квадратная матрица nxn (n=m), то вектор вероятностей можно найти, решив систему уравнений. Этот метод используется не всегда и применим только в отдельных случаях (если матрица 2x2 , то решение игры получается практически всегда). Если в решении получаются отрицательные вероятности, то данную систему решают симплекс-методом.
  2. Решение игры графическим методом.
    В случаях, когда n=2 или m=2 , матричную игру можно решить графически .
  3. Решение матричной игры симплекс-методом.
    В этом случае матричная игра сводится к

Суть каждого принимаемого руководством решения - выбор наилучшей из нескольких альтернатив по конкретным установленным заранее критериям. (Если вы захотите вспомнить рассмотрение ограничений и критериев для принятия решений, обратитесь к гл. 6).Платежная матрица - это один из методов статистической теории решений, метод, который может оказать помощь руководителю в выборе одного из нескольких вариантов. Он особенно полезен, когда руководитель должен установить, какая стратегия в наибольшей мере будет способствовать достижению целей.

По словам Н. Пола Лумбы: <Платеж представляет собой денежное вознаграждение или полезность, являющиеся следствием конкретной стратегии в сочетании с конкретными обстоятельствами. Если платежи представить в форме таблицы (или матрицы), мы получаем платежную матрицу>, как показано на рис. 8.4. Слова <в сочетании с конкретными обстоятельствами> очень важны, чтобы понять, когда можно использовать платежную матрицу и оценить, когда решение, принятое на ее основе, скорее всего будет надежным. В самом общем виде матрица означает, что платеж зависит от определенных событий, которые фактически свершаются. Если такое событие или состояние природы не случается на деле, платеж неизбежно будет иным.

В целом платежная матрица полезна, когда:

1. Имеется разумно ограниченное число альтернатив или вариантов стратегии для выбора между ними.

2. То, что может случиться, с полной определенностью не известно.

3. Результаты принятого решения зависят от того, какая именно выбрана альтернатива и какие события в действительности имеют место.

Кроме того, руководитель должен располагать возможностью объективной оценки вероятности релевантных событий и расчета ожидаемого значения такой вероятности. Руководитель редко имеет полную определенность. Но также редко он действует в условиях полной неопределенности. Почти во всех случаях принятия решений руководителю приходится оценивать вероятность или возможность события. Из предшествующего рассмотрения напомним, что вероятность варьирует от 1, когда событие определенно произойдет, до 0, когда событие определенно не произойдет. Вероятность можно определить объективно, как поступает игрок в рулетку, ставя на нечетные номера. Выбор ее значения может опираться на прошлые тенденции или субъективную оценку руководителя, который исходит из собственного опыта действий в подобных ситуациях.

Если вероятность не была принята в расчет, решение всегда будет соскальзывать в направлении наиболее оптимистических последствий. Например, если исходить из того, что инвесторы на удачной кинокартине могут иметь 500% на инвестированный капитал, а при вложении в торговую сеть - в самом благоприятном варианте всего 20%, то решение всегда должно быть в пользу кинопроизводства. Однако если взять в расчет, что вероятность большого успеха кинофильма весьма невысока, капиталовложения в магазины становятся более привлекательными, поскольку вероятность получения указанных 20% очень значительна. Если взять более простой пример, то выплаты при ставках в заезде на длинную дистанцию на скачках выше, поскольку выше вероятность, что не выиграешь вообще ничего.

Вероятность прямо влияет на определение ожидаемого значения - центральной концепции платежной матрицы. Ожидаемое значение альтернативы или варианта стратегии - это сумма возможных значений, умноженных на соответствующие вероятности. К примеру, если вы считаете, что вложение средств (как стратегия действий) в киоск для торговли мороженым с вероятностью 0,5 обеспечит вам годовую прибыль 5000 долл., с вероятностью 0,2 - 10 000 долл. и с вероятностью 0,3 - 3000 долл., то ожидаемое значение составит.



Похожие статьи
 
Категории