В ситуации, когда один игрок наказывает другого за обман, действует стратегия «око за око, зуб за зуб». Эта стратегия оказалась настоящим открытием, сделанным в ходе самого известного эксперимента с дилеммой заключенных. В следующем разделе вы узнаете об этом эксперименте и его уроках.
В начале 1980-х годов политолог Мичиганского университета Роберт Аксельрод предложил специалистам по теории игр со всего мира разработать стратегии решения дилеммы заключенных в виде компьютерных программ. Они были распределены по парам, каждая из которых разыгрывала дилемму заключенных 150 раз. На основании набранных очков составили рейтинг программ, принимавших участие в турнире.
Победителем стал профессор математики университета в Торонто Анатолий Рапопорт. Его выигрышная стратегия оказалась одной из самых простых: «око за око, зуб за зуб». Для Роберта Аксельрода этот результат явился большой неожиданностью, поэтому он решил провести еще один турнир, увеличив число участников. Рапопорт и в этот раз подал программу, основанную на той же стратегии, – и снова победил.
Стратегия равноценных ответных действий – один из вариантов правила поведения «поступайте с другими так, как они поступают с вами» {52}. Если говорить более точно, эта стратегия подразумевает сотрудничество на первом этапе, после чего повторяются действия, которые предпринял соперник на предыдущем этапе.
По мнению Роберта Аксельрода, стратегия равноценных ответных действий опирается на четыре принципа, которые должны присутствовать в любой эффективной стратегии для повторяющейся дилеммы заключенных: понятность, доброжелательность, возмездие и прощение. Стратегия равноценных ответных действий очень проста и понятна: сопернику нет необходимости долго размышлять над вашим следующим ходом или просчитывать его. В основе такой стратегии лежит доброжелательность: она никогда не инициирует обман. В этой стратегии есть элемент возмездия: она не оставляет обман безнаказанным. Кроме того, эта стратегия стимулирует прощение: участники игры не держат зла друг на друга слишком долго и готовы возобновить сотрудничество.
Одна из самых впечатляющих характеристик стратегии равноценных ответных действий состоит в том, что она показала лучшие результаты по итогам всего турнира, хотя и не победила (и не могла победить) ни одну из конкурирующих стратегий в прямом противостоянии с ними. В лучшем случае эта стратегия может только сравнять счет с соперником. Следовательно, если бы Аксельрод оценивал каждую игру по принципу «победитель получает все», стратегия равноценных ответных действий имела бы на своем счету только проигрыши и ничьи, а значит, не добилась бы победы по итогам всего турнира {53}.
Однако Аксельрод оценивал парные игры между компьютерными программами не по принципу «победитель получает все»: в его турнирах учитывался такой фактор, как готовность к сотрудничеству. Большое преимущество этой стратегии заключается в том, что она сближает соперников. В худшем случае эта стратегия может потерпеть поражение из-за одного предательства, но дальше – только ничья.
Стратегия равноценных ответных действий стала победителем этих соревнований именно потому, что стимулировала сотрудничество, не допуская при этом эксплуатации. Другие стратегии были либо слишком ориентированными на доверие и открытыми для эксплуатации, либо слишком агрессивными и побуждающими игроков выбивать друг друга из игры.
И все-таки мы считаем, что стратегия равноценных ответных действий – ошибочная. Малейший промах или неправильное толкование результатов приводят к полному провалу стратегии. Этот недостаток не был столь очевидным в искусственной среде соревнования между компьютерными программами, поскольку там просто исключались ошибки и неправильное толкование. Однако в случае применения этой стратегии в реальном мире ошибки и заблуждения неизбежны, а результат может оказаться катастрофическим.
Проблема стратегии равноценных ответных действий состоит в том, что обе стороны противостояния повторяют ошибки и заблуждения друг друга. Одна сторона наказывает другую за предательство, и это вызывает цепную реакцию. Соперник отвечает на наказание ответным ударом, который влечет за собой очередное наказание. В таком противостоянии может и не наступить момент, когда одна из сторон приняла бы наказание без ответного удара.
Предположим, Флад и Дрешер разыгрывают стратегию равноценных ответных действий. Поначалу ни один из них не идет на предательство, поэтому какое-то время все складывается хорошо. Затем, скажем, в 11-м раунде игры Флад по ошибке выбирает стратегию «предать» или останавливается на стратегии «сотрудничать», но Дрешер по ошибке считает, что Флад выбрал предательство. В любом случае Дрешер выберет в 12-м раунде ход «предать», но Флад выберет стратегию «сотрудничать», поскольку Дрешер выбрал сотрудничество в 11-м раунде. В 13-м раунде они поменяются ролями. Ситуация, когда один из игроков выберет сотрудничество, а другой – предательство, будет повторяться снова и снова до тех пор, пока очередная ошибка или заблуждение не восстановят сотрудничество между соперниками или не заставят каждого из них выбрать предательство.
Такие циклы или ответные удары часто наблюдаются во время реальных конфликтов между израильтянами и арабами на Ближнем Востоке, или между католиками и протестантами в Северной Ирландии, или между индусами и мусульманами в Индии. На границе между штатами Западная Вирджиния и Кентукки шла памятная вражда между Хэтфилдами и Маккоями. В художественной литературе тоже можно найти яркие примеры того, как такие действия могут привести к непрекращающемуся циклу ответных ударов, как в случае вражды между Грэнджерфордами и Шепердсонами в романе Марка Твена.