предыдущие ходы и действовали соответственно. И вот однажды, пока мимо окна носились соколы, на исследователей снизошло вдохновение.
Другое название стратегии «Простак» — «Павлов». Хотя, по мнению некоторых, это еще более обманчиво, ибо рефлексивной данная стратегия не является — как раз наоборот. Новак признает, что ему следовало дать ей более неуклюжее, зато и более точное имя «Победа — повторяй/поражение — меняй». Но, поскольку он так этого и не сделал, «Павловым» она и осталась. Эта стратегия — сродни игроку в рулетку (точнее, несколько упрощенной его версии). Если он выигрывает, поставив на красное, то ставит на красное и в следующий раз. А если проигрывает, то пробует черное. В нашем случае выигрыш — 3 или 5 очков («награда» и «искушение»), проигрыш — 1 или о («наказание» и «штраф простофиле»). Такой принцип — отказ менять свое поведение, пока оно дает желаемый результат, — лежит в основе большей части повседневной деятельности, включая дрессировку собак и воспитание детей. Последнее целиком и полностью построено на допущении, что малыши будут совершать поступки, за которые их вознаграждают, и прекратят делать то, за что их наказывают.
Такой принцип — отказ менять свое поведение, пока оно дает желаемый результат, — лежит в основе большей части повседневной деятельности, включая дрессировку собак и воспитание детей.
Для стратегии «Павлов» характерна добропорядочность (как «Око за око») — ибо она устанавливает сотрудничество, взаимность — ибо она отвечает добротой на доброту, и прощение (как «Великодушной») — ибо она наказывает за ошибки, но потом вновь возвращается к сотрудничеству. При всем этом ей свойственна мстительность, позволяющая эксплуатировать таких наивных кооператоров, как «Всегда сотрудничай». Играя против простофили, «Павлов» всегда предает. Таким образом, он создает сотрудничающий мир, не позволяя последнему превратиться в слишком доверительную утопию, где будут процветать «халявщики».
Слабое место этой стратегии хорошо известно. Как обнаружил Рапопорт, она беспомощна перед непорядочной «Всегда предавай». «Павлов» постоянно смещается к сотрудничеству и получает «штраф простофиле» — отсюда, кстати, и ее первоначальное название «Простак». Иными словами, «Павлов» не может распространиться, пока «Око за око» не сделает свое дело и не устранит «плохих ребят». Впрочем, Новак и Зигмунд обнаружили, что такой изъян «Павлова» проявляется исключительно в детерминированной игре — той, в которой все стратегии определены заранее. В более реалистичном мире вероятностей и обучения, где каждая стратегия бросала кубик, чтобы решить, как поступить дальше, происходило нечто совершенно иное. «Павлов» быстро приспособил вероятности таким образом, что его превосходство больше не могло быть оспорено «Всегда предавай». Вот она, подлинная эволюционно стабильная стратегия74.
Рыбьи игры: кто струсит первым?
А используют ли стратегию «Павлов» животные или люди? Пока Новак и Зигмунд не опубликовали свои идеи, одним из лучших примеров «Око за око» в животном мире являлся эксперимент Манфреда Милински с рыбой колюшкой. Ее и другую мелкую рыбешку ест щука. Стоит той появиться поблизости, как от