Глубокое -отсечение
Рассмотрим дерево игры на рис. 2.4. Пусть известны оценки f(X) =иf(E) =z..
Докажем следующую лемму.
Лемма 2.3.Еслиf(E), то ветви, исходящие из вершиныDи помеченные штриховой линией, можно отсечь.
Доказательство. Так как игрокB стремится минимизировать оценочную функцию, то для вершиныD будет справедлива следующая оценкаf(D) f(E) , а для вершиныC, ход из которой делает игрокA, стремящийся максимизировать оценочную функцию, соответственноf(C) f(D).
Рассмотрим две возможности:
f(C) =f(D), что означаетf(C) f(E) , т.е. имеем согласно лемме 2.2 неглубокоеотсечение, означающее неперспективность для игрокаAвообще всех продолжений из вершиныY.
f(C) f(D), что означает неучастие (неперспективность) вершиныD для получения оценкиf(C).
Лемма доказана.
Рис. 2.5 иллюстрирует применение метода - отсечений.
Рис. 2.5. Глубокое-отсечение
Из рис. 2.5 видно, что игроку Aрекомендуется в качестве первого хода выбрать продолжение, ведущее к вершинеX.
Рис. 2.6. Применение метода-отсечений
Табл. 2.1 иллюстрирует процедуру - отсечения.
Таблица 2.1
Ход | Наилучшая оценка | Позиция на глубину | Оценка позиции | Условие отсечения | Действие |
A (max) | | Своя | z | z | отсечение |
B (min) | | Противника | w | w | отсечение |
Заметим, что оценка возрастает при движении по дереву снизу вверх, а оценка, наоборот, убывает.
Приведем сравнительные оценки методов максимина и отсечений. Пусть оценивается дерево на глубину ходов (уровней)n(для равенства ходов игроковn должно быть четным) и на каждом уровне имеетсяmвариантов выбора. Тогда сложность вычислений равна:
mnдля метода максимина;
2mn/2 для метода-отсечения.
Таким образом, метод -отсечений позволяет при тех же затратах памяти, что и метод максимина, построить дерево в среднем на глубину, в два раза большую, а значит, найти более качественное решение. Эффективность метод-отсечений возрастает, если удается предварительно упорядочить оцениваемые вершины по убыванию оценкии возрастанию оценки.
К недостаткам рассмотренных методов относятся:
по сути оба метода не являются стратегиями и базируются на классических переборных алгоритмах с использованием оценочной функции;
наличие эффекта горизонта, т.е. методы «не видят» выигрыша, который находится за горизонтом (ниже по дереву) оцениваемых вершин.
- Теоретико-игровые методы принятия решений
- Isbn 5-7046-1383-7
- Введение
- Основные понятия теории игр. Классификация игровых моделей
- Основные понятия теории игр
- Классификация игровых моделей
- Контрольные вопросы к разделу 1
- Антагонистическая игра. Поиск решения на дереве игры
- Представление антагонистической игры
- Поиск решения на дереве игры
- Общие замечания
- Метод максимина
- Метод-отсечений
- Неглубокое -отсечение
- Глубокое -отсечение
- Контрольные вопросы к разделу 2
- Методы решения антагонистических игр, представленных в матричной форме
- Матричное представление антагонистической игры
- Наличие седловой точки
- Методы решения матричных игр при отсутствии седловой точки
- Смешанные стратегии
- Метод Лагранжа
- Метод линейного программирования
- Итерационный метод Брауна-Робинсона
- Практический пример
- Контрольные вопросы к разделу 3
- Игра двух лиц с произвольной суммой
- Определение игры двух лиц с произвольной суммой
- Теория Нэша для некооперативных игр
- Рефлексивная игра
- Практический пример
- Контрольные вопросы к разделу 4
- Основы теории статистических решений. Игры с «природой»
- Определение игры «с природой»
- Методы решения игр «с природой»
- Случай стохастической неопределенности
- Случай с неизвестными вероятностями состояний «природы»
- Контрольные вопросы к разделу 5
- Игры с упорядоченными исходами
- Определение игры с упорядоченными исходами при наличии ряда критериев
- Поиск решения игры с упорядоченными исходами
- Контрольные вопросы к разделу 6
- Программная система для решения антагонистических игр
- Общее описание системы
- Примеры работы с системой
- Практический пример
- Контрольные вопросы к разделу 7
- Библиографический список
- Оглавление