5.5. Игры с ненулевой суммой и кооперативные игры
В игре с ненулевой суммой уже становится необязательно, чтобы один из участников выигрывал, а другой проигрывал; напротив, они могут и выигрывать, и проигрывать одновременно. Поскольку интересы игроков теперь не являются полностью противоположными, их поведение становится более разнообразным.
Так, например, если в игре с нулевой суммой каждому игроку невыгодно было сообщать другому свою стратегию (это могло уменьшить его выигрыш), то в игре с ненулевой суммой становится желательным координировать свои действия с партнером или каким-либо способом влиять на его действия.
Игры с ненулевой суммой могут быть кооперативными и некооперативными. В некооперативных играх игроки принимают решения независимо друг от друга либо потому, что осуществление соглашения невозможно, либо потому, что оно запрещено правилами игры.
Один из подходов к решению некооперативных игр состоит в определении точек равновесия игры. Понятие равновесия в теории игр шире понятия оптимальности в теории оптимизации и включает последнее в качестве частного случая. В общем случае пара стратегий X, Y для Игрока 1 и Игрока 2 называется точкой равновесия по Нэшу, если ни одному из игроков невыгодно отклоняться от своей стратегии в одиночку, если выигрыш при этом не увеличивается.
Рассмотрим пример, когда матрица выигрышей игры имеет следующий вид:
.
Легко видеть, что в данной игре пары стратегий х = (1, 0), у = (1, 0) и х=(0,1), у = (0,1) являются равновесными, т.е. Игроку 2 (1) невыгодно отклоняться от 1-й (2-й) стратегии, если Игрок 1 (2) придерживается 1-й (2-й) стратегии. Отметим также, что выигрыши в равновесных точках различны.
Доказано, что для любой конечной некооперативной игры с ненулевой суммой (называемой также биматричной игрой) всегда существует, по крайней мере, одна равновесная пара смешанных стратегий. В общем случае равновесное решение может быть неединственным, и каждому из решений могут соответствовать различные значения выигрыша каждого из игроков.
Кооперативной игрой называется игра с ненулевой суммой, в которой игрокам разрешается обсуждать перед игрой свои стратегии и договариваться о совместных действиях, т.е. игроки могут образовывать коалиции. Основная задача в кооперативной игре состоит в дележе общего выигрыша между членами коалиции.
В случае игры двух лиц предполагается, что два игрока не могут воздействовать друг на друга, пока не придут к некоторому соглашению.
На множестве возможных выигрышей выделяется множество Парето-оптимальных решений, т.е. множество точек, принадлежащих некоторому множеству S, для которых увеличение выигрыша одного из игроков возможно только за счет уменьшения выигрыша его партнера.
Рассмотрим пример, в котором имеются два продавца, продающие определенный товар на рынке. Оба из них знают, что чем выше цена, тем меньше общий объем продаж [5].
Для простоты предположим, что каждый из них может продать либо 400 единиц некоторого товара, либо 100 единиц. Известно, что при продаже 800 единиц на рынке складывается цена, равная 100 денежным единицам (д.е.), при 500 единицах — 200 д.е., а при объеме продаж 200 единиц — 500 д.е. Матрица выигрышей продавцов показана в табл. 5.5.
Таблица 5.5
Матрица выигрышей
Продавец 1 / Продавец 2 | 400 | 100 |
400 | 40000/40000 | 80000/20000 |
100 | 20000/80000 | 50000/50000 |
Если бы игроки имели возможность и желание согласовывать свои действия, то они решили бы продать по 100 единиц и получить прибыль по 50 000 д.е. каждый.
Предположим теперь, что по каким-либо причинам они принимают решения независимо друг от друга. Каковы оптимальные стратегии для игроков в этом случае? Пара стратегий (400,100) не является ситуацией равновесия, так как в этом случае второму игроку выгодно изменить свою стратегию на 400 и тем самым увеличить свой выигрыш с 20000 до 40 000 д.е.
Если рассмотреть пару стратегий (100,100), то она также не является ситуацией равновесия, поскольку каждому отдельному игроку выгодно поменять свою стратегию на 100 и получить вместо 50 000 д.е. выигрыш в 80 000 д.е. Если же мы рассмотрим пару стратегий (400,400), то отклонение каждого отдельного игрока является для него невыгодным. Эта ситуация называется ситуацией некооперативного равновесия.
Таким образом, основным определяющим свойством ситуации некооперативного равновесия является невыгодность для каждого отдельного игрока отклоняться от своей стратегии, входящей в ситуацию равновесия. В этом случае речь не идет о каких-либо договоренностях между игроками и поэтому такое равновесие называется некооперативным. Напротив, когда возможность достижения определенных договоренностей между игроками существует, игроки стараются найти такую пару стратегий, для которой не существует другой пары, одновременно улучшающей выигрыши обоих игроков. Такая пара стратегий называется ситуацией кооперативного равновесия. В рассмотренном ранее примере это пары стратегий (100,100).
Этот пример игр можно отнести к так называемым биматричным играм, суть которых состоит в следующем. Пусть первый игрок имеет m чистых стратегий, а второй игрок имеет п чистых стратегий. Выигрыши первого игрока при различных выборах стратегий игроками задаются матрицей А1=— платежная матрица первого игрока, а А2 =— платежная матрица второго игрока.
На практике решение в чистых стратегиях для биматричных игр встречается крайне редко, поэтому решение ищется в смешанных стратегиях, которые определяются так же, как и для матричных игр соотношениями (5.3) и (5.4). Среднеожидаемые выигрыши игроков в этом случае определяются соотношениями
и .(5.6)
В биматричных играх существует несколько критериев оптимальности. Важнейшими из них являются критерий оптимальности по Парето и критерий, выделяющий ситуации равновесия по Нэшу. Основные определения этих двух подходов.
1. Оптимальность по Парето. Пусть имеется несколько целевых функций F1(z),..., Fn(z), каждую из которых хотят максимизировать. Вектор решения z называется оптимальным по Парето (или эффективным), если не существует другого вектора z*, для которого значения всех функций Fi(z)≥Fi(z*), и хотя бы одно неравенство строгое.
Суть данного подхода состоит в том, что рассматриваются решения, которые лучше по одному критерию, но хуже по другому, и нет такого вектора, который был бы лучше сразу по всем критериям.
Множество эффективных векторов называется множеством Парето, а любой вектор этого множества — оптимумом по Парето.
В случае биматричной игры z = (x, у), а в качестве целевых функций рассматриваются функции V(x,y) и W(х,у), заданные соотношениями (5.6).
2. Ситуации равновесия по Нэшу. Это такая пара смешанных стратегий (х*, у* ), что для любых произвольных стратегий х и у выполняются неравенства V(x*, у*) ≥ V(х, у* ) и W (x*, у*) ≥ W(x*, у).
Смысл ситуации равновесия в том, что никому из игроков в одиночку невыгодно от нее отклоняться, его выигрыш при этом не увеличивается.
Справедлива следующая основная теорема теории биматричных игр.
Теорема Нэша. Существует хотя бы одна ситуация равновесия в любой биматричной игре.
Замечание. В разных ситуациях равновесия (их может быть несколько) выигрыши игроков различны.
- Введение
- Понятие об экономико-математических методах и моделях
- 1.1.Определение модели и цели моделирования
- 1.2. Последовательность построения экономико-математической модели
- 1.3. Классификация экономико-математических методов
- 1.4. Классификация экономико-математических моделей
- 1.5. Объекты моделирования
- 1.6. Цель, критерий и ограничения в экономико-математических моделях
- 2. Математические модели рынка
- 2.1. Понятие рыночного равновесия
- 2.2. Паутинообразная модель рынка
- 2.3. Существование и единственность рыночного равновесия
- 2.4. Государственное регулирование рынка. Налоги
- . Дотации
- 2.6. Фиксированные цены
- 2.7. Оценка прибыли и убытков при государственном регулировании рынка
- 2.8. Поддержание стабильных цен и производственные квоты
- 2.9. Принципы ценообразования в рыночной экономике. Диверсификация цен
- 2.9.1. Диверсификация цен в зависимости от дохода покупателя
- 2.9.2. Диверсификация цен в зависимости от объема потребления
- 2.9.3. Диверсификация цен по категориям товаров
- Совокупная прибыль
- 2.9.4. Диверсификация цен по времени
- 3. Производственные функции
- 3.1. Виды производственных функций
- 3.2. Функция Кобба-Дугласа
- 3.3. Модель Солоу
- 3.4. Модель Стоуна
- 3.5. Двойственная задача потребительского выбора
- 3.6. Функция спроса Маршалла
- 3.7. Модель общего равновесия Вальраса
- 3.8. Рыночное равновесие в модели Леонтьева
- 3.9. Пример построения производственной функции
- Значения коэффициентов парной корреляции
- 3.10. Производственные функции и прогнозирование
- 4. Модели оптимального планирования
- 4.1. Оптимизация прибыли предприятия
- Исходные данные для предельного анализа
- 4.2. Оптимизация прибыли методами математического программирования
- Исходные данные для решения задачи оптимизации
- 4.3. Оптимизация прибыли при ограничениях на используемые ресурсы
- Исходные данные по изделиям
- Результаты расчета Таблица 4.8
- 4.4. Планирование оптимальной мощности строительного предприятия
- Для решения задачи на пк коэффициенты целевой функции, матрицы ограничений и правые части ограничений необходимо записать в виде симплекс-матрицы (табл.4.10).
- Оптимальное значение целевой функции – 240,000.
- 4.5. Модели стохастического программирования
- 4.6. Модели оптимального планирования транспортного типа
- 4.7. Решение задач по планированию перевозок
- 4.8. Производственно-транспортные модели
- 4.9. Транспортные модели с промежуточными пунктами
- 4.10. Модели параметрического программирования
- 4.11. Модель распределения инвестиционных ресурсов между строительными организациями, прошедшими конкурсный отбор
- 4.12. Производственно-транспортная задача прикрепления источников теплоснабжения к потребителям продукции
- 5. Матричные игры
- 5.1. Классификация матричных игр
- 5.2. Игры с нулевой суммой
- 5.3. Решение игры в чистых стратегиях
- 5.4. Решение игры в смешанных стратегиях
- Очевидным следствием из теоремы о минимаксе является соотношение
- 5.5. Игры с ненулевой суммой и кооперативные игры
- 5.6. Введение в теорию игр п лиц
- 5.7. Позиционные игры
- 5.8. Выбор оптимальной стратегии в условиях неопределенности (игры с природой)
- 5.8.1. Специфика ситуации полной неопределенности
- 5.8.2. Критерии выбора оптимальной стратегии
- 5.9. Применение теории матричных игр в управлении
- 5.10. Сведение матричной игры к задаче линейного программирования Рассмотрим игру, платежная матрица которой имеет размерность
- 5.11. Решение игры с применением процессора электронных таблиц
- 5.12. Определение победителя подрядных торгов с применением теории игр
- 6. Имитационное моделирование
- 6.1. Метод Монте-Карло
- 7. Моделирование систем массового обслуживания
- 7.1. Одноканальная модель с пуассоновским входным потоком с экспоненциальным распределением длительности обслуживания
- 7.2. Многоканальная модель с пуассоновским входным потоком и экспоненциальным распределением длительности обслуживания
- 8. Модели оценки эффективности инвестиционных проектов
- 8.1. Расчет абсолютных и относительных показателей эффективности проекта
- 8.2. Применение процессоров электронных таблиц для оценки эффективности инвестиций
- 8.3. Оптимальное планирование портфеля инвестиций
- 8.4. Учет факторов риска при оценке инвестиций
- 8.5. Определение уровня недиверсифицируемого риска методом корреляционно-регрессионного анализа
- Исходные данные для расчета
- 9. Модели оценки финансового состояния предприятия
- 9.1. Виды моделей
- 9.2. Статическая и динамическая модели оценки финансового
- Коэффициенты рентабельности
- Оценка деловой активности
- Оценка финансовой устойчивости
- Оценка платежеспособности и ликвидности
- Рекомендуемые значения оцениваемых показателей
- Вопросы и задания
- Заключение
- Библиографический список
- Экономико-математические методы и модели
- 394006 Г.Воронеж, ул. 20-летия Октября, 84