В некоторых играх нет комбинации действий, которая удовлетворяла бы условию Нэша. Рассмотрим игру «Орлянка» на рис. А.3. Каждый из двух игроков одновременно выбирает либо орла, либо решку. Если их выбор не совпадет, игрок 2 проигрывает, получив -1, тогда как игрок 1 получает 1. Если они совпадут, игрок 1 проигрывает, получив -1, а игрок 2 получает 1. В этой игре, согласно определению, нет равновесия Нэша. Такое отсутствие равновесия отражает то, что эта игра рисует ситуацию, в которой каждый игрок пытается угадать действия другого игрока. Если игрок 1 ожидает, что игрок 2 выберет орла, наилучшим ответом с его стороны будет выбрать решку. Но если игрок 2 ожидает, что игрок 1 выберет решку, его наилучшим ответом будет выбрать решку. Если 1 ожидает, что 2 выберет решку, его наилучший ответ – выбрать орла. Если 2 ожидает, что 1 выберет орла, его наилучшим ответом будет также выбрать орла, и цикл начнется снова.
Вполне разумно, что в таких ситуациях ожидания людей относительно поведения будут вероятностными по своей природе. Люди начнут ожидать, что другие будут выбирать то орла, то решку. Теория игр также определяет равновесие Нэша в таких случаях. Для этого действия в множестве действий игрока (A) называются чистыми стратегиями, и определяется смешанная стратегия как распределение вероятностей по чистым стратегиям игрока. Тогда мы можем решить так называемые равновесия Нэша со смешанной стратегией. В игре «Орлянка» и в игре «Движение по дороге», например, разыгрывание каждого действия с вероятностью 0,5 для каждого игрока является равновесием Нэша со смешанной стратегией.
Любая игра с конечным количеством игроков, каждый из которых имеет ограниченное количество чистых стратегий, имеет равновесие Нэша, хотя возможно и в смешанных стратегиях. Путем ограничения комбинаций стратегий (т. е. планов поведения) теми, что являются самоподдерживающимися в смысле равновесия Нэша, теория игр ограничивает спектр допустимого поведения в таких играх.
Хотя описанные здесь ситуации очень просты, тот же самый анализ может быть применен к более сложным случаям, в которых игроки производят ходы последовательно и в которых существует информационная асимметрия или неопределенность. Понятия равновесия, используемые применительно к таким ситуациям, как правило, являются усовершенствованиями равновесия Нэша, т. е. равновесиями Нэша, удовлетворяющими некоторым дополнительным условиям. Последующее обсуждение динамических игр иллюстрирует природу таких усовершенствований и полезность наложения дальнейших ограничений на допустимое самоподдерживающееся поведение.
Рассмотрим динамическую ситуацию, в которой игроки делают ходы последовательно, а не одновременно. Динамические игры легче представлять в расширенной (древовидный график), а не в нормальной (матричной) форме, используемой в рис. А.1–3. В расширенной форме игра представляется в виде графа или древа, в котором каждое ответвление – точка принятия решения для игрока, а каждая ветвь ассоциируется с отдельным действием. Выигрыши, ассоциирующиеся с различными действиями, приводятся в конце древа.
Хотя в динамических играх может быть множество ветвей и поворотных точек, их базовую структуру можно проиллюстрировать на примере игры с двумя точками принятия решений. В этой игре игрок 1 выбирает действие а из множества осуществимых решений А. Наблюдая за выбором игрока 1, игрок 2 выбирает действие а из множества осуществимых решений А. После того как игроки выбрали свои действия, они получают выигрыши u(a, a) для игрока 1 и u(a, a) для игрока 2.
РИС. А.4. Игра «Односторонняя дилемма заключенного»
Примером динамической игры с такой структурой является односторонняя дилемма заключенного (рис. А.4). Сначала игрок 1 выбирает, сотрудничать или нет. Если он выбирает отказ от сотрудничества, игра заканчивается и выигрыши игроков составляют (0,5; 0). Если игрок 1 выбирает сотрудничество, игрок 2 может выбрать какое-либо действие. Если он решает сотрудничать, выигрыши обоих игроков равны 1, но если он решает смошенничать, он получает больший выигрыш, 2, тогда как игрок 1 получает 0. В этой игре игроку 1 сотрудничество выгодно, но только если игрок 2 тоже сотрудничает. Если игрок 2 мошенничает, игрок получает меньший выигрыш, чем в случае, если бы он отказался от сотрудничества.
Динамические игры, такие как «Односторонняя дилемма заключенного», представляют интерес для социальных наук, потому что они передают главное в отношениях обмена – личных, социальных, экономических и политических. Обмен всегда является последовательным: между quid и quo всегда проходит некоторое время [Greif, 1997a; 2000]. Говоря обобщенно, в социальных отношениях прежде, чем что-то получить, приходится давать, и в тот момент, когда ты что-то отдаешь, ты получаешь лишь обещание получить что-то в будущем.
Может ли игрок 1 поверить в то, что игрок 2 будет сотрудничать? Чтобы это выяснить, мы должны пойти обратно по древу игры, изучив оптимальное действие игрока, предположительно делающего ходы в каждой точке принятия решения. Такой метод известен как обратная индукция.
РИС. А.5. Односторонняя игра «Дилемма заключенного» в матричной форме
Рассмотрим решение игрока 2. Его выигрыш составляет 2, если мошенничает, и 1, если сотрудничает, из чего следует, что мошенничество является для него оптимальным выбором. Ожидая этого, игрок 1 выберет отказ от сотрудничества и получит 0,5, вместо того чтобы сотрудничать и получить 0. (Эти ветви выделены жирным в графике древа игры на рис. А.4.) Данная комбинация действий является самоподдерживающейся, потому что наилучшим ответом на отказ от сотрудничества является мошенничество. Обратная индукция открывает самоподдерживающуюся комбинацию действий – не сотрудничать, мошенничать. Такая комбинация действий является равновесием Нэша.