Теория управления. Принципы системного анализа
Рассмотрим примеры формального представления игр.
Обозначим через I множество всех игроков, через St - множество возможных действий игрока i , называемое множеством стратегий.
Например:
а) игра в орлянку
I = {1, 2}, Sf = {Орел, Решка};
б) голосование в парламенте
I = {1, 2, ., n},
где n - число голосующи
х, Si = {За, Против, Воздержался};
в) взаимодействие на рынке двух продавцов
I = {1, 2} Si = {Pi: Pi > 0},
где Pi - цена продаваемого товара.
В партии игроки выбирают каждый свою стратегию , в результате чего складывается набор стратегий s = (s1, s2,…,sn), называемый ситуацией.
В рассмотренных выше примерах приведем возможные ситуации:
а) (Орел, Орел), (Орел, Решка), (Решка, Орел), (Решка, Решка);
б) (За, За, Против, За, Воздержался, … , Против);
в) (5 рублей, 3 рубля), (5 рублей, 7 рублей).
Заинтересованность игроков в конкретных ситуациях проявляется в том, что каждому игроку i в каждой ситуации s присваивается число, выражающее степень удовлетворения его интересов в данной ситуации. Это число называется выигрышем игрока i и обозначается Нi(s).
Вернемся к указанным выше примерам.
В игре в орлянку.
Н1(Орел, Орел) = Н1(Решка, Решка) = 1,
Н1(Орел, Решка ) = Н1 (Решка, Орел ) = -1,
Н2(Орел, Орел) = Н2(Решка, Решка) = -1,
Н2(Орел, Решка) = Н2(Решка, Орел) = 1.
Видно, что в любой ситуации Н1 + Н2 = 0.
Запишем это в виде матрицы выигрышей, где строки будут соответствовать стратегиям 1-го игрока, столбцы - стратегиям 2-го игрока.
При этом или Н1 + Н2 = 0.
Таким образом, орлянка является примером игры с нулевой суммой.
При голосовании в парламенте считается, что вопрос прошел при большем количестве проголосовавших «За», чем «Против», в противном случае – вопрос не прошел. Получаем:
В случае взаимодействия на рынке двух продавцов предположим, что потребитель приобретет товар у фирмы, объявившей меньшую цену, или распределит свой спрос поровну между фирмами в случае, если цены равны.
Если d(p) - функция спроса в зависимости от цены на товар, то функция выигрыша.
9.3 Определение бескоалиционной игры
Бескоалиционной игрой будем называть такую игру, в которой целью каждого игрока является получение по возможности большего индивидуального выигрыша.
Обозначим.
I - множество всех игроков. Далее будем считать I конечным. Обычно принято различать игроков по номерам, т.е. считать I = {1, 2, ., n};
Si - множество стратегий игрока , т.е. множество возможных действий, имеющихся в распоряжении игрока i. Считается, что Si содержит не менее двух возможных стратегий, иначе его действия заранее определены.
Процесс игры состоит в выборе каждым из игроков одной своей стратегии . Таким образом, в результате каждой партии игры складывается система стратегий s = (s1, s2, .,sn), которая называется ситуацией.
Множество всех ситуаций S=S1×S2×…×Sn, т.е. S является декартовым произведением множеств стратегий всех игроков. Обозначим: Hi(s) - выигрыш игрока i в ситуации s. Функция Hi, определенная на множестве всех ситуаций, называется функцией выигрыша игрока i.
Hi: S → R, т.е. каждой ситуации Hi - сопоставляет вещественное число.
Бескоалиционной игрой называется система , в которой I и Si () являются множествами, а Hi - функции на множестве S=S1×S2×…×Sn, принимающие вещественные значения.
Бескоалиционная игра называется игрой с постоянной суммой, если существует такое постоянное число C, что , т.е. сумма выигрышей игроков постоянна в любой ситуации.
9.4 Приемлемые ситуации и ситуации равновесия
Ситуацию s в игре Г естественно считать приемлемой для игрока i, если этот игрок, изменяя в ситуации s свою стратегию на какую-либо другую, не может увеличить этим своего выигрыша.
Пусть s = (s1, s2, ., si-1, si, si+1, ., sn) - произвольная ситуация в игре, а si - некоторая стратегия игрока i.
Рассмотрим новую ситуацию , получившуюся из ситуации s заменой стратегии si игрока i на s'i . Очевидно, что s||s'i = s, если s'i совпадает с si (s'i = si).
Ситуация s в игре Г называется приемлемой для игрока i, если
Смысл названия «приемлемая» состоит в том, что, если в некоторой ситуации s для игрока i найдется такая стратегия s΄i, что то игрок i в случае складывающейся ситуации s может получить больший выигрыш, выбирая s΄i, вместо si. В этом смысле ситуация s для игрока может считаться неприемлемой.
Ситуация s называется ситуацией равновесия (или равновесной ситуацией), если она приемлема для всех игроков, т.е.
Из определения видно, что в ситуациях равновесия и только в них ни один игрок не заинтересован в отклонении от своей стратегии.
Равновесной стратегией игрока в бескоалиционной игре называется такая его стратегия, которая входит хотя бы в одну из равновесных ситуаций игры.
Процесс нахождения ситуаций равновесия в бескоалиционной игре называется решением игры.
9.5 Примеры игровых задач
«Дилемма заключенных»
Предположим, игроками 1 и 2 являются преступники, находящиеся в предварительном заключении по подозрению в тяжком преступлении. Прямых улик против них нет, и возможность их обвинения в значительной мере зависит от того, сознаются ли преступники сами.
Судья предложил каждому следующую сделку. Если он сознается в преступлении, а другой нет, то сознавшийся получает 1 год наказания, а несознавшийся – 10 лет. Если сознаются оба, то каждый получит по 7 лет. Заключенным известно, что если никто из них не сознается, то оба получат по 3 года.
Запишем функции выигрышей (потерь) игроков в рассмотренной игре.
Другие рефераты на тему «Безопасность жизнедеятельности и охрана труда»:
Поиск рефератов
Последние рефераты раздела
- О средствах защиты органов дыхания от промышленных аэрозолей
- Обзор результатов производственных испытаний средств индивидуальной защиты органов дыхания (СИЗОД)
- О средствах индивидуальной защиты от пыли
- И маски любят счёт
- Правильное использование противогазов в профилактике профзаболеваний
- Снижение вредного воздействия загрязнённого воздуха на рабочих с помощью СИЗ органов дыхания
- О средствах индивидуальной защиты органов дыхания работающих