d9e5a92d

СТАБИЛЬНОСТЬ НА ОСНОВЕ УГРОЗ

Сообщение типа М. есть просто обычная чистая стратегия М. Как и в случае равновесия в совместных смешанных стратегиях, выполнение соглашения с проведением лотереи L обеспечено автоматически. В самом деле,
щ{ОВ, ОЯ) = -§-их(Я, ^) + yux(l н)йх(Уі, ОВ) =
= L) + T?il^1’ H) для всех У* в М Н}'
ы*(ОВ, OB) = ~u2{L, Я) + ^-и2(Я, L) = 2н2(ОВ, у2) =
= ~и2(Н, y2) + ^u2(L, у2) для всех у2 в {L, М, Я}.
!) В данном случае доминирование является строгим: лг,- строго доминирует уі, если U{{x(, дсг) Ui(jyi, дсг) для любого набора xt?XvПрим, перев.
В противоположность равновесию в совместных смешанных стратегиях решение о согласии с лотереей не может быть отменено после реализации конкретного исхода: это решение должно быть принято раз и навсегда до случайной реализации.
Определение 3 (Мулен, Виал [1978]). Для всех і g N обозначим Lt сужение распределения L на Хд?ч(г}, а именно:
Lt(xt)= 2 ?(*.- хі) для всех xt.
Х{6Х;
Скажем, что лотерея L есть слабое равновесие в совместных смешанных стратегиях в игре G, если выполнены следующие неравенства:
V € N, у*/,- € 2 и* (*) L{x) 2 г (Уь xt) L, (xt).
xeXN xi^xN\{i)
Обозначим через WCE (G) множество слабых равновесий в игре G.
Лемма 2. (1) Множество WCEifi) есть непустое выпуклое компактное подмножество единичного симплекса в RXn. Оно содержит множество СЕ (G) равновесий в совместных смешан-ных стратегиях.
2) Если (хисход игры Gm, то соответствующая лотерея
L= ® р.: является слабым равновесием в совместных смешан-іел/
ных стратегиях в игре G тогда и только тогда, когда исход р есть равновесие по Нэшу в игре Gm.
Доказательство. По определению 3 лотерея L принадлежит множеству WCE(G) тогда и только тогда, когда
V* € N уу{ € X, 2 Щ (х) ? (*) 2 Щ (Уі, xt) L (*).
х 6Хfj * 6 Хдг
Эти неравенства получены из системы (4) суммированием по хі$Х{ при фиксированных і и у;. Итак, окончательно имеем
CE{G)=WCE(G).
Остальные утверждения леммы 2 очевидны.
Определение 3 является последним шагом в развитии концепции стабильных соглашений, основанных на рандомизации и на тайном выборе стратегий. Начав с равновесий по Нэшу в чистых стратегиях, мы сначала допустили независимую рандомизацию индивидуальных стратегий (смешанные стратегии) и установили, что стабильные соглашения существуют, если игроки имеют возможность проводить свои лотереи тайно (теорема 1 гл.

IV). Далее, если игроки могут устраивать совместные лотереи и посылать изолированные сигналы каждому участнику, то множество равновесий становится выпуклым. Из лемм 1 и 2 следует, что
NE (G) а NE (Gm) а СЕ (G) с WCE (G).
Проходя по этой цепочке включений слева направо, мы должны накладывать все больше информационных ограничений для того, чтобы равновесный исход стал стабильным соглашением. Для NE-исхода и для смешанного М?-исхода требуется только соблюдение секретности в выборе индивидуальных стратегий. Для СЕ-исхода мы должны в дополнение к этому потребовать, чтобы отдельные игроки могли наблюдать только свои собственные реализации совместной лотереи.

Для WCE-исхода нужен нейтральный арбитр, который реализует случайный исход лотереи, ничего не сообщая отдельным игрокам. Затем этот арбитр спрашивает независимо и тайно каждого игрока, согласен ли тот вслепую использовать ту стратегию, которая реализовалась при проведении лотереи.

Далее он должен сообщить тем игрокам, которые добровольно согласились с проведением лотереи, выпавший исход и заставить этих игроков действительно использовать рекомендованные стратегии. Короче говоря, арбитр должен иметь возможность пресекать любое стратегическое использование конкретной реализации лотереи.
Общей чертой этих сценариев с усложняющейся информационной структурой является невозможность по достижению договоренности о выборе некоторой совместной стратегии вести прямой обмен информацией между игроками. В случае многократного проведения лотереи кооперация становится неявной, и трудно обнаружить сам факт ее существования. Такая форма молчаливого сговора описана в литературе о поведении фирм в условиях олигополии: Среди соглашений, возможных при олигополии, выделим те, при которых нет явного обмена информацией между участниками.

Одним из примеров такого соглашения является сговор по электрическому оборудованию 1950-х годов (Шерер [1970]), в который были замешаны 29 компаний США, продающих различные виды товаров. Правительство США организовало аукцион, в котором каждая фирма должна была тайно и независимо друг от друга назвать свою цену на некоторый вид электротехнического оборудования.

Однако фирмы провели предварительные секретные переговоры, в которых была определена доля каждой фирмы, участвующей в аукционе. Затем продавцы согласовали свою политику назначения цен на аукционе так, чтобы каждый из них оказался предложившим наименьшую цену (и, следовательно, получил бы заказ от правительства) достаточное число раз для захвата заранее определенной доли рынка. Это было достигнуто за счет раздела рынка на четыре зоны, причем к каждой зоне были приписаны различные продавцы.

Продавцы, прикрепленные к одной зоне, чередовали свои ставки. При определении привилегии назначения наименьшей цены ориентировались на фазы луны.

В результате получился якобы случайный процесс, имитирующий независимое поведение участников (Жерар-Варе, Мулен [1978]).
Упражнение 4
Докажите, что в игре музыкальные стулья (пример 4) все четыре множества ME (G), ME (Gm), СЕ (G) и WCE (G) различны. Докажите, что оптимальные по Парето СЕ-выигрыши покрывают
отрезок [(-- т). (т т)]’ а оптимальные по Парето WCE-выигрыши покрывают отрезок. [(2, 1), (1, 2)].
Упражнение 5
Пусть в игре G = (Xi, i g N) каждое множество Х{ состоит из двух элементов. Докажите, что
CE(G)=WCE{G).
Задача 1
Слабое равновесие в совместных смешанных стратегиях и равновесие по Нэшу (Мулен [1976])
Фиксируем игру двух лиц G = (Xlt Х2, ult м2) с конечными множествами стратегий Xlt Х2 и обозначим через Gm == (Мг, УИ2, и1, иг) ее смешанное расширение. Для совместной лотереи L обозначим через Lv L2 (вместо Lt, Lj) сужение L соответственно на Хи Х2. Заметим, что Li^,Mh t=l, 2. Обозначим, наконец, через [,-, L] математическое ожидание выигрыша игрока i, t'= 1, 2, при лотерее L.
1) Исход (uf, ц*) игры Gm назовем сверхравновесием по Нэшу ((pf, р2) g N+E (Gm)), если не существует такой лотереи L, для которой выполнено
[ и{ (pf, ?,)[,-, L] для і=1, 2, іФ і,
\ причем по крайней мере одно неравенство строгое.
Интерпретация; для любого возможного соглашения L либо у какого-то игрока возникнет желание выбрать стратегию N+E (Gm) (и, (pf, Lj) [и,-, L]), либо для обоих игроков нет разницы между применением стратегии N+E (Gm) и выполнением соглашения при условии, что партнер также выполняет соглашение (, (pf, Lj) =[,-, L1 для t= 1, 2, ІФІ).
Докажите, что М+Е-исход является смешанным XT:-исходом.
2) Обозначим через М+Е (Gm) множество всех У?+^-исходов в игре Gm, а через N^Ei проекцию этого множества на мно.
жество M.t. Докажите, что
N+EiGJczN+EiXN+EtCNEiGJ. (10)
Указание: если (р1( р2) и (vlf ?2) принадлежат множеству N+Е (Gm), то докажите, что
?,) =^(1*,, ?2),
'V2)==U2(M'1i ''’l)-
3) Докажите, что равновесие в доминирующих стратегиях является также і?+?-исходом:
Di (i)xD2 (u2)ciV+?(GJ.
Докажите, что при условии непустоты множества N+E (Gm) множество N+ErxN+Ег содержит доминирующий по Парето элемент р*:
1 +Е1хУ+Ег уі = 1, 2 и,- (р) Щ (р*),
\ V* +ExxN+Ег.
4) Докажите, что исход р* = (р*, pf) является N+E-исходом в игре Gm тогда и только тогда, когда существует действительное число %, 0^ 1, такое, что
V (хі -^г) €X Х2: Хи1(х1, х2)--(1 Х)иг(хj, хг)
kFj (pf, x2) -f (1 Цйг (xlt p*) (11)
(где с некоторым нарушением принятых обозначений и{ (р,-, xj) стоит вместо и{ (р,, б, )).
Выведите отсюда, что множества Л!+E(Gm) и N+Eh і = 1, 2, компактны.
5) Предположим теперь, что функция и{ действительно зависит от х{, t = l, 2, т. е.
3^( € X/ Xj^Xj Uf (Xj, Xj) Ф иi (Xj, Xj). (12)
Обозначим через WCE (Gm) (возможно пустую) внутренность множества WCE (Gm) относительно единичного симплекса в Докажите следующую эквивалентность:
LZWbCEiGJlUiiXi, Lj) [и{, L], і= 1, 2, \фі, х,€Х,.].
(13)
6) В дополнение к (12) предположим, что ни у одного игрока нет доминирующей стратегии в игре Gm.
Докажите следующую эквивалентность:
, WCE^0 N+E = 0.
Указание: Полагая, что Z = X1[)X2 есть объединение множеств Xj и X2, которые считаются непересекающимися, рассмотрите следующую действительную функцию /, определенную на Х{і2}XZ:
?(*і x2)?Xll2} yz?Z f((xlt х2), z) =
M*i, xt)~і(г. х2), если г?Хи и2(хи х2) и2(хг), если г$Х2.
Проверьте, что цена ? игры (Х{12}, Z, /, /) в смешанных стратегиях является неотрицательной.
Покажите, что величина ? равна нулю тогда и только тогда, когда для некоторого %, 0 X 1, выполнено неравенство (11). Покажите далее, что величина ? положительна в том и только в том случае, если существует лотерея L, для которой выполнены неравенства из правой части (13).

СТАБИЛЬНОСТЬ НА ОСНОВЕ УГРОЗ

В этой главе будем предполагать, что игроки по-прежнему стремятся к кооперации, однако, принимая во внимание стратегическую взаимозависимость, присущую игре в нормальной форме, они теперь при выборе собственной стратегии учитывают возможную реакцию остальных. Угрожая друг другу, они могут стабилизировать весьма обширное множество исходов.

Поэтому будем рассматривать угрозы как механизм кооперации.
В течение длительного времени кооперация при взаимных предостерегающих угрозах изучалась в экономической литературе, посвященной проблемам олигополии. Так, например, при рассмотрении дуополии по Курно (пример 5 гл. Ill) отмечалось, что исход, реализующий наибольшую суммарную прибыль, не является равновесием по Нэшу, поскольку одностороннее увеличение какой-либо фирмой своего предложения увеличивает ее текущий доход.

Это действие вынуждает другую фирму также увеличивать свое предложение, что в результате приводит к тому, что оба игрока проигрывают по сравнению с исходной ситуацией. Как отмечает Шерер [1970], каждая фирма с большой неохотой идет на такие меры, которые могут в результате реакции других фирм привести к последствиям, нежелательным сразу для всей отрасли (см. также пример 5 ниже).


Предостережение является весьма мощным механизмом кооперации. Для достижения стабильности соглашения игроки угрожают друг другу, т. е. объявляют некоторую схему реагирования на возможные отклонения.

Поскольку отклоняющемуся игроку может стать плохо, если объявленная угроза осуществится, то он поостережется отклоняться, и необязательное соглашение окажется стабильным.
Таким образом, предостережение является разумным использованием потенциальной силы. Успешной является та угроза, которая никогда не реализуется (Шеллинг [1971]).
Стабильные соглашения, рассматриваемые в гл. V, требовали полной секретности принятия стратегических решений. В про-
тивопо$ожность этому угроза является эффективной только в том случае, когда отклонение нельзя скрыть. Следовательно, для достижения стабильности на основе предостережений требуется, чтобы все индивидуальные выборы стратегий производились в открытую. Известны многочисленные военные и экономические примеры ограничения на секретность в выборе стратегий в целях стабилизации кооперативных решений (см. разд.

1).
Основной концепцией равновесия в данной главе является a-ядро, х. е. множество таких исходов, которые при соответствующих угрозах являются стабильными относительно отклонений любых коалиций (разд. 2) Если возможны только индивидуальные отклонения, то с помощью предостерегающих угроз можно-стабилизировать любой дележ игры (разд.

1).
Если a-ядро пусто, то нужны более сложные сценарии предостережений, включающие контругрозы, для того чтобы стабилизировать хотя бы некоторые дележи при возможности коалиционных отклонений (разд 2) Если, напротив, a-ядро не пусто, то при наложении дополнительных условий на предостерегающие угрозы возникают специфические подмножества a-ядра. Одним из таких подмножеств является (3-ядро, которое в особенности полезно при анализе повторяющихся игр (разд. 3).

В разд. 4 для игры двух лиц мы определяем другое подмножество а-ядра, а именно у-ядро; у ядро состоит из тех дележей, которые могут быть стабилизированы при правдоподобных угрозах, т. е. при поведении, основанном на наилучших ответах.

Это приводит к качественной классификации игр двух лиц.
В разд. 5 содержится другая формализация игры, а именно рассматриваются игры в характеристической форме (с побочными платежами).

В качестве стабильного множества для таких игр вводится ядро, которое задается в данном случае конечной системой линейных ограничений, что позволяет получить простые численные результаты.
1. ДЕЛЕЖИ
Пример 1. Кооперативное решение дилеммы заключенного
Некооперативным исходом дилеммы заключенного является война (пример 1 гл. I): (Л^ Л2). Для того чтобы обеспечить мирный исход (Рг, при кооперации, каждый игрок объявляет принцип своего поведения: как ты, так и я, т. е.
если ты будешь вести себя мирно, то я тоже буду вести себя мирно, (1)
если ты будешь агрессивным, то и я буду агрессивным
Приняв во внимание такую угрозу от своего оппонента, каждый игрок предпочтет быть миролюбивым, так как это приводит к миру (исход (Plt Рг)), иначе будет война (исход (Alt Л2)). Так проявляется свойство стабильности' угрозы (1).
Двусторонние угрозы не образуют пару допустимых действий. Для того чтобы реализовать поведение типа (1), игрок должен действовать как ведомый, т. е. знать выбор партнера.

Если игроки выбирают стратегии раз и навсегда, то только один игрок может находиться в положении ведомого. Вместе с тем дилемма заключенного является симметричной игрой, и мы хотим, чтобы кооперативный исход (мир) был обеспечен сценарием предостережений, в котором игроки имели бы симметричные роли. Для преодоления этой трудности можно представлять себе, что игра является повторяющейся и совокупный выигрыш будет, грубо говоря, взвешенной .суммой текущих выигрышей.

Если краткосрочный доход от некооперативного отклонения перекрывается долгосрочными потерями, возникающими в результате реакции типа (1), то сценарий предостережений обеспечивает стабильность мирного кооперативного исхода (см. разд. 3 ниже). Здесь мы приведем наиболее простую с математической точки зрения конструкцию для формализации кооперации на основе угроз.

Игрокам нужно только прийти к договоренности о некотором исходе игры, и для каждого игрока выбрать угрозу, предостерегающую его от отклонения от данного исхода.
Определение 1. Пусть G = (Xh up, i?N) игра в нормальной форме. Назовем сценарием предостережений набор {х, ??; і ? N), где х € XN исход игры G, а г для всех і € N обозначает угрозу игроку і, т. е. отображение из Х{ в Х^^щ, такое, что
(2)
St (* () = *,,
ЩІУі, ЫУі))Щ(*)-
Проиллюстрируем сценарий предостережений, рассматривая игру, разыгрываемую на бесконечном интервале времени. В каждый конкретный момент времени каждый игрок выбирает некоторую стратегию, причем он может поменять свою стратегию в любое время.

Игра происходит в открытую, т. е. стратегии всех игроков всем известны. Это главное информационное предположение, которое делает невозможным тайное нарушение договора.
Игрок, который выполняет соглашение, вначале выбирает согласованную с остальными стратегию х{ и затем наблюдает за текущими стратегиями yt других игроков. Пока уі = Хи игрок і сохраняет стратегию xh как только какой-то игрок, скажем /, переключается на стратегию г/у- ф Xj, игрок і переключается раз и навсегда на t-ю компоненту tiiyj)- Условие стабильности (2) означает, что если все игроки выполняют договор, основанный на сценарии предостережений, то ни у какого игрока не возникает повода для (одностороннего) нарушения соглашения.

В самом деле, выигрыш на бесконечном интервале времени всегда превышает выигрыш на любом промежутке конечной длины.
В определении 1 учитываются только отклонения отдельных игроков. В следующем разделе это определение будет обобщено на случай отклонений коалиций (см. определение 3).
Конечно, иногда трудно выполнить требование вести игру в открытую. Так, в частности, при современном вооружении неожиданное нападение становится все более опасным.

Таким образом, создание демилитаризованных зон, в которых видны все агрессивные действия, или соглашения о взаимной инспекции ядериого оружия вот два примера механизмов обмена информацией типа предостерегающих угроз. Другим примером является бюро открытых цен, которое удерживает конкурирующие фирмы от тайного применения политики скидок покупателям и, следовательно, смягчает общую конкуренцию (Шерер [1970]).
С другой стороны, англо-японское соглашение об ограничении производства военных кораблей не включало в себя специального пункта о контроле за выполнением соглашения, поскольку оно было подписано в то время, когда тайное строительство таких объектов считалось невозможным. (См. Арон [1962].)
Будем придерживаться обозначений, принятых в определении 1.
Лемма 1. 1. Пусть (х, Zt; i?N)сценарий предостережений. Тогда исход х является индивидуально рациональным:
sup ini и f (у;, yf)^ue(x) для всех i?N. (3)
h yt
2. Предположим, что компакт, а щнепрерывная функция, i?N. Тогда в игре G существует по крайней мере один индивидуально рациональный исход. Для каждого такого исхода х при всех существует набор угроз f, такой, что
(х, \й і 6 N) является сценарием предостережений.
Доказательство. Из (2) получаем inf и, (у,-, ytXu;(y{, Ь ІУдХщіх) для всех yt^X{.
Отсюда следует первое утверждение леммы 1. Докажем обратное утверждение. При наших топологических предположениях у каждого игрока есть по крайней мере одна осторожная стратегия, скажем xt (см. лемму 3 гл. I).

Тогда исход * = (*і)і=л/ является индивидуально рациональным.
Далее, для каждого i g N и для любой стратегии у,- g Хь Уіфхі выберем элемент yt ЬІУі) € XN\{i], такой, что
иіІУі, yt)==iniui(yit zt) sup inf щ (zit zt)u,(x).
2! H *f
Это завершает доказательство леммы 1.
Определение 2. Дележом в игре G (X h и;\ i g N) называется оптимальный по Парето индивидуально рациональный исход. Обозначим через / (G) множество дележей в игре G.
Лемма 2. Пусть для любого і g N множество Xкомпактно, а функция U; непрерывна. Тогда в игре G есть по крайней мере один дележ.
Доказательство аналогично доказательству леммы 3 гл. I.
Обозначим через IR(G) непустое компактное подмножество индивидуально рациональных исходов во множестве всех исходов игры G. Выберем далее элемент х из IR(G), который максимизирует 2 иі на 1R (G). Тогда х Является оптимальным по
16 N
Парето исходом. Предположим от противного, что исход у доминирует по Парето исход х. Тогда г/ g //? (G) и 2 ,- (*) 2 ui(y)-
isN is N
Полученное противоречие доказывает лемму.
Дележ является оптимальным по Парето исходом и приносит каждому игроку по крайней мере его гарантированный выигрыш. По лемме 1 любой дележ является исходом оптимального по Парето сценария предостережений, т. е. необязательного соглашения, стабильного относительно индивидуальных отклонений, а также относительно возражений коалиции N всех игроков (оптимальность по Парето).

С другой стороны, двумя минимальными требованиями для кооперативных соглашений как раз и являются индивидуальная рациональность (никакого игрока нельзя заставить получать меньше гарантированного уровня, пока он сам контролирует выбор собственной стратегии) и оптимальность по Парето (поскольку договор заключается при единогласном одобрении всех участников). Следовательно, множество / (G) является максимальной областью переговоров о кооперации. Если игра G несущественна (или почти несущественна, см. задачу 1 гл.

Ill), то множество I (G) одноэлементно и кооперативный исход игры не вызывает сомнения. Но в большинстве игр множество / (G) состоит из большого количества исходов, ч выбор среди них является острой конфликтной ситуацией.
Пример 2. Игра Торг
Игрок 1 продает (неделимый) товар игроку 2. Игрок 1 должен решить, какую назначить цену: высокую или низкую. Для поку--пателя в принципе приемлемы обе цены.

Покупатель не может спорить о цене, он может либо сделать покупку, либо отказаться от нее.
Игрок 1-
Исход (/, /) является равновесием в доминирующих стратегиях, кроме того, он оптимален по Парето. Если игроки не имеют возможности обмениваться информацией, этот исход является, по-видимому, бесспорным итогом игры.

Однако это не единственный дележ игры. Другим дележом является исход (II, /). Для того чтобы выиграть (т. е. продать товар по высокой цене), игрок 1 может объявить, что он будет продавать товар только по высокой цене, т. е. действовать в качестве лидера. С другой стороны, игрок 2 выигрывает, угрожая продавцу: Я буду покупать по низкой цене и откажусь от сделки в случае назначения высокой цены.

Это кажущееся неразумным поведение (поскольку покупатель отказывается от выгодной сделки) оказывается весьма выгодным, если только продавец поверит этой угрозе. С кооперативной точки зрения мы не можем отдать предпочтение ни одному из названных сценариев предостережения или, другими словами, не берем на себя роль арбитра в этом конфликте с двумя антагонистическими угрозами (решимостью продавца назначить высокую цену и отказом покупателя приобретать товар, если не будет назначена низкая цена), которые могут осуществиться одновременно только на исходе, доминируемом по Парето (несостоявшаяся сделка).
В разобранном выше примере покупатель выигрывает, используя радикальную угрозу: На любое твое отклонение я буду реагировать минимизацией твоей функции выигрыша (т. е. я буду применять наихудший для тебя ответ) ‘). Этот радикализм может привести к тому, что выполнение угрозы окажется пагубным для обоих игроков.

Объявление покупателя, что он отказывается от сделки при назначении высокой Цены, является, как он надеется, только предостерегающим сигналом. Однако, для того чтобы угроза произвела впечатление, нужно, чтобы не было сомнений в том, что она будет приведена
!) В отечественной литературе такая угроза получила название стратегии наказания.Прим, перев.
в исполнение. В этом смысле даже наиболее убедительные и успешные угрозы являются рискованными, если объявленная реакция на отклонения не совпадает с наилучшим ответом угрожающего игрока. Сравните, например, агрессивную угрозу и предупреждение в приведенной ниже лемме 3.
Соотношение между убедительностью и рискованностью предостерегающих угроз для игр двух лиц проанализировано в разд. 4.
Ситуация, которая имела место в примере 2, легко обобщается на произвольную игру двух лиц.
Рассмотрим игру двух лиц (Xlt Х2, и,, и2), где множества Xt компактны, а функции и; непрерывны, і= 1, 2. Наилучшим дележом для игрока і является исход х', такой, что



Содержание раздела