Правило транзитивности против нетранзитивности выбора

Доктор психологических наук Александр Поддьяков, Национальный исследовательский университет «Высшая школа экономики», Федеральный институт развития образования

Памяти Евгения Яковлевича Гика.

Фото Натальи Домриной.
Наука и жизнь // Иллюстрации
Кости Эфрона — наборы нетранзитивных костей, изобретённые Брэдли Эфроном. Четыре кости A, B, C, D имеют на своих гранях следующие числа: A: 4, 4, 4, 4, 0, 0; B: 3, 3, 3, 3, 3, 3; C: 6, 6, 2, 2, 2, 2; D: 5, 5, 5, 1, 1, 1. Результат броска каждой кости из набора больше результата бросания следующей кости с вероятностью 2/3.
Рис. 1.
Рис. 2.

В известной игре «камень—ножницы—бумага» оба играющих должны одновременно, по счёту «раз, два, три», показать либо сжатый кулак («камень»), либо кулак с оттопыренными указательным и средним пальцами («ножницы»), либо ладонь со всеми растопыренными пальцами («бумага»). Игрок, показавший камень, выигрывает у игрока, показавшего ножницы («камень тупит ножницы»). Игрок, показавший ножницы, выигрывает у игрока, показавшего бумагу («ножницы режут бумагу»). Но игрок, показавший бумагу, выигрывает у игрока, показавшего камень (как объясняется, камень можно завернуть в бумагу, и это завёртывание, закрытие рассматривается как лишение «боеспособности»). Итак, камень побеждает ножницы, ножницы — бумагу, а бумага — камень. Нельзя однозначно сказать, что «победоноснее», — ответ зависит от того, с чем предстоит столкнуться.

Аналогичный принцип взаимодействия описан в сказках: например, кошка пугает мышку и командует ею, собака пугает кошку и командует ею и т. д., но самый последний и, казалось бы, самый сильный и влиятельный участник этой пирамиды боится мышки, то есть самого слабого участника.

Иерархия подобных систем не выстраивается в «победную» пирамиду с указанием первого, второго и последнего места, а образует круг. Результат конкретного столк-новения в такой системе определяется не местом участника в линейном упорядоченном рейтинге (его здесь вообще невозможно выстроить), а только взаимодействием с конкретным соперником.

Возникает вопрос: стоят ли за всеми этими ситуациями реальные объективные закономерности конфликтных и иных взаимодействий или же это всего лишь проявление присущей фольклору (играм, сказкам) тенденции к обыгрыванию парадоксального и заведомо невозможного? Ответ таков: за последние десятилетия в самых разных научных областях накопился целый массив ярких доказательств того, что взаимодействия по принципу «камень — ножницы — бумага» — это весьма распространённая закономерность взаимодействия сколько-нибудь сложных систем.

Для такого типа отношений между системами используется термин «нетранзитивные», или «непереходные» (в отличие от транзитивных отношений, примером которых служит математическое отношение порядка: если a > b и b > c, то a > c). При нетранзитивных отношениях превосходство системы А над В, а В над С не переходит, не распространяется и на пару А—C: система А не превосходит систему C или даже уступает ей.

«Камень — ножницы — бумага» в биологии

Реальные отношения «бойцовской» силы по типу «камень—ножницы—бумага» были во множестве обнаружены на разных уровнях в биологии — от межвидовой конкуренции (например, вид микроорганизмов A вытесняет B, B вытесняет C, C вытесняет A) до внутригрупповых стратегий конкуренции самцов за самок и отношений доминирования внутри группы животных.

Самки мух дрозофил могут спариваться с несколькими самцами, при этом в организме самки начинается конкуренция (взаимоподавление) спермы нескольких самцов. Эта конкуренция нередко разворачивается по принципу «камень—ножницы—бумага»: сперма самца A подавляет сперму самца B, сперма самца B подавляет сперму самца C, а сперма самца C подавляет сперму самца A.

Если обратиться к более высокому уровню конкуренции — конкуренции поведенческих стратегий животных, то в биологических исследованиях было обнаружено, что у некоторых видов ящериц (и не только у ящериц) самцы-агрессоры, вторгающиеся на чужие территории, в борьбе за воспроизводство чаще побеждают самцов, использующих стратегию обороны, но проигрывают в этой борьбе «тихушникам», мимикрирующим под самок. А «тихушника» в свою очередь успешно идентифицирует обороняющийся тип. (Забавная характеристика «тихушник» предложена биологом и научным журналистом Натальей Резник.)

У животных, ведущих групповой образ жизни (в стаях, стадах и пр.), обнаружено существование таких отношений доминирования, когда особь A доминирует над особью B, B над C, а C над A. (В семейных отношениях людей это тоже нередко наблюдается.)

В биологических экспериментах выявлена странная на первый взгляд особенность предпочтений некоторых цветов у пчёл. При возможности выбора между двумя находящимися рядом цветками А и В пчела выбирает цветок А (A для неё предпочтительнее В), при выборе между В и С предпочитает В (B предпочтительнее C), но при выборе между A и C предпочитает С (C предпочтительнее A). Возможное рациональное объяснение этой «нелогичности» выбора состоит в том, что некоторые растения угнетающе действуют на растения другого вида, и если пчела «знает» это на инстинк-тивном уровне или воспринимает своими рецепторами, то она может избегать цветов, ставших в ходе этой борьбы неприятными, опасными (или, наоборот, стремиться к цветам, ставшим особенно вкусными), что и приводит к таким предпочтениям. Эта «нетранзитивная привлекательность» находящихся рядом цветов означает, что их опыляемость тоже нетранзитивна: в паре A—B цветок A опыляется чаще, чем B; в паре B—C цветок B опыляется чаще, чем C; но в паре А—C чаще будет опыляться цветок C, чем A.

Изучение нетранзитивности предпочтений у животных — отдельное исследовательское направление. В университете Бристоля работает научная группа, изучающая принятие решений животными, Modelling Animal Decisions (аббревиатура MAD читается по-английски и как «сума-сшедшие»). В работах её сотрудников доказывается, что выбор животными тех или иных объектов по принципу «камень—ножницы—бумага» часто вполне рационален, хотя и выглядит на первый взгляд нарушением законов логики.

Краткий обзор явлений нетранзитивности в биологии, данный выше, далеко не полон. На настоящий момент серии биологических статей со словами «камень—ножницы—бумага» в заголовках опубликованы в таких журналах мирового уровня, как «Science» и «Nature», и во многих других. В этих публикациях обосновывается мысль, что данный принцип является необходимым условием поддержания биоразнообразия. В них также даются рекомендации философского уровня: «Не уничтожай полностью своего противника — возможно, он кормится кем-то, кто после его гибели плотно займётся тобой».

Технические системы

В шоу «Битвы роботов», популярном у многих любителей техники и зрелищ, на арене бьются друг с другом дистанционно управляемые механизмы, напоминающие бульдозеры, кувалды на колёсах, самодвижущиеся дисковые пилы и т. п. Схватка длится до выхода механизма из строя. За многие годы проведения этих соревнований в них обнаружилось явление, аналогичное нетранзитивным конкурентным отношениям в биологии. Его назвали «рободарвинизмом». Некоторые типы устройств в этой среде (условно назовём их, например, «быстрые бульдозеры») чаще побеждают в схватках с устройствами другого типа (например, с «кувалдами», которые едва успевают замахнуться в нужном направлении, как их уже с налёта выбрасывают за пределы арены). Но при этом «быстрые бульдозеры» проигрывают устройствам третьего типа, у которых «кувалды» в основном выигрывают.

Многое здесь зависит от особенностей конкретного устройства и искусства игрока по управлению им (это ведь не схватка самостоятельных устройств, а схватка людей посредством дистанционно управляемого механизма; здесь мощно работает и человеческий фактор — опыт, интуиция, скорость реакции, эмоции и т. д.). Поэтому собственно «рободарвинизм» — это статистическая закономерность, а не строгий закон. Но в её основе лежит объективное соотношение свойств «боевых единиц» (используемого вооружения, защиты, манёвренности и др.), и она достаточно отчётлива, что позволило ввести для неё специальное название.

В борьбе компьютерных программ — участниц соревнований по тем или иным интеллектуальным играм нередко наблюдается аналогичная ситуация: программа А может значимо чаще выигрывать у программы В, та — у С, а программа С, вроде бы самая слабая в этой тройке, может значимо чаще выигрывать у А. Если бы речь шла о людях-спортсменах (а в спорте такие ситуации тоже не редкость), это могло бы объясняться психологическими и физиологическими причинами (например, большей спортивной злостью членов одной команды по отношению к другой, бо`льшим физическим утомлением и демотивированностью кого-то из спортсменов и т. д.). Но речь идёт о технических системах на основе искусственного интеллекта, не знающих усталости и эмоций (пока). Причина в том, что нет идеальных технических (биологических и пр.) систем, совершенных со всех точек зрения. Каждая система имеет свои достоинства и недостатки, сильные и слабые стороны, проявляющиеся в различных условиях. Сильные и слабые стороны участников сочетаются таким образом, что возникает нетранзитивный цикл побед и поражений.

Отвлекаясь от темы конкуренции, битв и схваток, приведу пример забавной и парадоксальной технической системы, в которой взаимодействия осуществляются по принципу «камень—ножницы—бумага». В механике показана возможность конструирования такой тройки шестерён (правда, не обычных, а двойных), что при их попарных соединениях первая шестерня вращается быстрее второй, вторая — быстрее третьей, а третья — быстрее первой. (Речь идёт именно об их соединениях по две, а не всей тройки в одно целое.) Посмотрев на эти шестерни, можно убедиться, что при попарных соединениях шестерня A вращается быстрее шестерни B, B — быстрее C, C — быстрее A.

Социальные взаимодействия людей: парадокс голосования

В социальных науках с конца XVIII века известен парадокс, названный по имени его открывателя — маркиза де Кондорсе. Интересно, что в XIX веке парадокс переоткрыл, анализируя выборы в Оксфордском университете, математик Льюис Кэрролл (известный как автор «Алисы в Cтране чудес») и написал о них несколько памфлетов. Парадокс голосования состоит в том, что групповые предпочтения избирателей, накладываясь друг на друга, могут становиться нетранзитивными. Большинство избирателей считают, что кандидат А лучше В, В лучше С, а С лучше А. Так каково же мнение большинства о том, кто лучше? Здесь нет однозначного ответа — при том, что индивидуальные предпочтения каждого члена группы логичны, последовательны и не закольцованы в круг «A лучше B, B лучше C, C лучше A».

Вот как выглядит простейшая версия парадокса:

Есть три избирателя: 1, 2, 3. Каждый из них на выборах ранжирует трёх кандидатов (А, В, С) следующим образом в порядке предпочтительности:

избиратель 1 ранжирует кандидатов в порядке А, В, С;

избиратель 2 ранжирует кандидатов в порядке В, С, А;

избиратель 3 ранжирует кандидатов в порядке С, А, В.

Можно видеть, что два избирателя из трёх (1-й и 3-й), то есть 2/3 всех голосующих, считают А более предпочтительным, чем В (А поставлен ими перед В). Два избирателя из трёх (1-й и 2-й), то есть тоже 2/3 голосующих, считают В более предпочтительным, чем С. И два избирателя из трёх (2-й и 3-й), тоже 2/3 голосующих, считают С более предпочтительным, чем А (!). При этом по сумме набранных голосов все кандидаты равны между собой. Индивидуальные транзитивные предпочтения парадоксальным образом трансформировались в нетранзитивные групповые. Этот парадокс был использован будущим нобелевским лауреатом Кеннетом Эрроу для доказательства его знаменитой теоремы о невозможности совершенной избирательной системы. Парадокс проявляется в различных версиях в самых разных ситуациях (экономических, житейских и пр.), когда люди принимают решение о выборе между несколькими возможностями, руководствуясь тремя и более критериями. Можно было бы сказать: так выработайте один критерий, но это требование часто упирается в ограничения, парадоксы и невозможности.

Сугубо математические игры?

Около 40 лет назад Мартин Гарднер, один из самых известных популяризаторов математики, привлёк внимание к так называемым нетранзитивным костям (или костям Эфрона, названным по имени их изобретателя, специалиста по статистике из Стэнфордского университета). Числа на этих костях (например, на игральных кубиках) таковы, что при попарных бросаниях первый кубик чаще выигрывает у второго (чаще показывает на верхней грани большее число, чем второй), второй кубик чаще выигрывает у третьего, а третий — у первого. Читателям, заинтересовавшимся, как подобраны числа и, шире, как такое возможно в принципе (у людей, не знакомых с этими объектами, сама их возможность не сразу укладывается в голове), можно порекомендовать книги Гарднера «Крестики-нолики» и «Путешествие во времени».

Нетранзитивные кости вскрывают интересную и важную коллизию: хотя элементарное отношение «быть больше», конечно, транзитивно (если 5 > 4 и 4 > 3, то 5 > 3), но сложное, составное отношение «чаще показывать большее число» оказывается нетранзитивным.

Нетранзитивные кости приобрели определённую известность среди интеллектуалов. Как пишет британский писатель Саймон Сингх, один из самых успешных инвесторов в мире Уоррен Баффет — «большой поклонник нетранзитивных игральных костей и часто предлагает cыграть с ним партию. Он без всяких объяснений вручает сопернику три нетранзитивные кости и просит первым сделать выбор. Сопернику кажется, будто это ставит его в более выгодное положение, поскольку у него есть шанс выбрать «лучшую» кость. Разумеется, лучшей кости просто не существует, и Баффет сознательно уступает первый ход, чтобы иметь возможность выбрать кость, более сильную по сравнению с той, на которую укажет соперник. Когда Уоррен Баффет решил провернуть этот трюк с Биллом Гейтсом, основатель Microsoft сразу же заподозрил неладное. Он достаточно долго изучал кости, а затем вежливо предложил Баффету сделать выбор первым»*.

Нетранзитивность отношения «чаще оказываться больше», вероятно, может иметь в ряде случаев значимые экономические следствия (даже если не брать ситуации мошенничества, основанного на чужом незнании нетранзитивности).

За последние десятилетия опубликовано много статей в научных и научно-популярных журналах, где показаны интересные свойства и закономерности, связанные с нетранзитивными костями. Например, было доказано, что цепочки, реализующие принцип «камень—ножницы—бумага», можно строить неограниченной длины, причём с участием не только кубиков, но и многогранников с произвольным числом граней, рулеток и т. д. Разработаны и алгоритмы генерации чисел для них.

Существуют также другие нетранзитивные игры, основанные на неочевидных математических закономерностях, — например, игра Пенни с подбрасыванием монет, которой посвящён юмористический рассказ С. Мельникова «Прыжок через козла» (см. «Наука и жизнь» № 5, 1997 г.).

Заметим, что математические модели нетранзитивности, воплощённые в этих, казалось бы, сугубо настольных играх, могут иметь и чисто физические и технологические следствия. Так, твёрдость оценивается по способности веществ или материалов царапать друг друга. При этом хорошо известно, что твёрдость транзитивна: если материал А твёрже материала B (царапает его), а B твёрже C, то A будет твёрже C (оцарапает его, но не наоборот). Алмазом можно оцарапать стекло, стеклом — графит, и уже из этого следует, что графит будет оцарапан алмазом, а не наоборот. Но представим, что у нас есть три композиционных материала, включающих в себя по три компонента разной твёрдости. Математическая модель нетранзитивных костей позволяет предположить существование и таких случаев, когда при контакте (трении, вдавливании) композиционных материалов A и B компоненты материала A чаще оказываются твёрже, чем компоненты В; компоненты материала B чаще оказываются твёрже, чем компоненты C; компоненты материала C чаще оказываются твёрже, чем компоненты A. Тогда объекты из этих материалов будут истирать, разрушать друг друга «нетранзитивно» (A разрушает B больше, чем B разрушает A; B разрушает C больше, чем C—B; но С разрушает A больше, чем A—C) — в отличие от гомогенных материалов, которые в данном отношении ведут себя проще. Эти тонкие эффекты, вероятно, могут оказаться важными в каких-то ситуациях.

Новые игры на основе уже известных: шахматные композиции?

Близкие по силе шахматисты могут систематически выигрывать друг у друга по схеме «А победил В, В победил С, С победил А», и более того — «...даже А. Алехин в международных шахматных соревнованиях 1930-х годов постоянно проигрывал Л. Асталошу, шахматисту практически неизвестному и ничем иным не прославившемуся»**. Это факты достаточно известные — настолько, что для более точной сравнительной оценки силы соперников (людей-игроков, игровых компьютерных программ) используются специальные процедуры и алгоритмы, учитывающие нетранзитивность.

Но вот вопрос, который раньше не ставился. Могут ли не игроки, а отдельные шахматные позиции быть в нетранзитивных отношениях предпочтительности по отношению друг к другу по принципу «камень—ножницы—бумага»? А именно: может ли быть так, что в случае возможности выбора игры за белых или же за чёрных, поглядев на доску, где стоят белые в расположении A и чёрные в расположении B, надо выбрать игру за белых (игру за A); поглядев на доску, где стоят чёрные в расположении В и белые в расположении С, надо выбрать игру за чёрных (игру за B); на доску, где стоят белые в расположении C и чёрные в расположении D, надо выбрать игру за белых (игру за C); а поглядев на доску, где стоят чёрные в расположении D и белые в расположении A, надо выбрать игру за чёрных (игру за D)?

Осенью прошлого года я задал этот вопрос по электронной почте Евгению Яковлевичу Гику, автору множества популярных книг о шахматах и других интеллектуальных играх и о связанных с ними математических проблемах, ведущему постоянной шахматной рубрики в журнале «Наука и жизнь». Хотя раньше мы не были знакомы (точнее, знакомство было односторонним — я читал его статьи), он с готовностью вступил в диалог и, уточнив детали, ответил так: «Мне кажется, что эта задача решается без труда. Например, в пешечном эндшпиле у С (белые) пешкой больше, чем в D у чёрных. У В (чёрные) пешкой больше, чем в С (у белых). У А (белые) пешкой больше, чем в В (у чёрных). Таким образом, в эндшпиле А выигрывает у В, В у С, С у D. Однако взаимное расположение пешек в А и D таково, что пешка чёрных при своём ходе может съесть белую и пройти в ферзи с победой. Значит, D выигрывает у А. Конечно, требуется чёткое оформление замысла».

Этот замысел, предложенный Е. Я. Гиком в ответ на мой вопрос о «нетранзитивных» позициях, я оформил — получилось. Но как именно, раскрывать не буду, поскольку кому-то из читателей, возможно, станет интересно пройти путь решения самому. Может быть, один из лучших способов отдать дань памяти Евгению Яковлевичу Гику — развить его шахматную идею.

При этом, чтобы показать, что нетранзитивные отношения предпочтительности в шахматных позициях действительно возможны, приведу следующий пример. Я сконструировал его в демонстрационных целях (как материал для задачи он нарочито прост, даже примитивен — например, мат в одной из комбинаций может ставиться одним очевидным ходом белых; моя цель — только показ самой возможности нетранзитивных отношений между шахматными позициями).

Возьмём два расположения белых и два расположения чёрных (рис. 1).

Проверим попарные наложения этих позиций на одну доску, чтобы определить предпочтительность выбора игры за ту или за другую сторону (белые начинают во всех вариантах) (рис. 2).

Можно увидеть, что при почему-либо возникшей возможности выбора одни позиции предпочтительнее других.

После того как возможность таких нетранзитивных отношений в шахматных позициях показана, можно ставить «нетранзитивные» задачи разного типа и разной сложности, а затем, при желании, соревноваться в успешности и красоте их решения. Вот некоторые возможности, которые на настоящий момент видятся мне (а у читателей могут появиться и другие).

1. Эксперименты по увеличению длины цепочки. Приведённый пример — это минимально короткая цепочка, она составлена из четырёх позиций. Возможны ли цепочки из 6, 8, 10 и более позиций? Там должны комбинироваться не два исходных расположения белых и два расположения чёрных, как в рассмотренных примерах, а больше — по три белых и три чёрных, по пять белых и пять чёрных и т. д. Чем длиннее цепочка, тем труднее её построить. Ведь каждое конкретное расположение белых или чёрных должно иметь свои решающие преимущества, но и одновременно (!) — критические уязвимости по отношению к сконструированным расположениям фигур другого цвета — соседям по цепочке. Здесь нужен искусный баланс создания сочетаний этих сильных и слабых сторон, ведущих к выигрышу у соседки по цепочке с одной стороны и к проигрышу у соседки по цепочке с другой. Чем длиннее цепочка, тем тоньше игра балансов преимуществ и уязвимостей.

С математической точки зрения интересно, какова вообще максимально возможная длина цепочки таких конфигураций. Для нетранзитивных костей (рулеток и пр.) с неограниченным выбором чисел на них показано, что цепочка может быть произвольной длины. Но для шахматных фигур на 64 полях ситуация заведомо иная — предел есть. Вопрос, насколько он близок или далёк. Есть место для рекордов по длине.

2. Эксперименты по минимизации количества и состава фигур в каждом звене цепочки. Например, проверка того, может ли быть так, чтобы в каждом звене были только две (три) фигуры. При желании можно наложить ограничения на выбор состава этих фигур.

3. Эксперименты по созданию «узоров» — симметричных конфигураций (с точностью до зеркального отражения, поворота, параллельного переноса). Здесь можно не озадачиваться минимизацией числа фигур и их состава. Чем симмет-ричнее, красивее, интереснее «узоры», тем лучше.

4. Поиск ответа на вопрос, возможны ли «нетранзитивные» позиции в шашках и других логических играх с размеченным игровым полем. В каких играх такие позиции возможны, а в каких нет?

Это лишь некоторые пути развития. Тема «камень—ножницы—бумага», как представляется, даёт хорошую возможность развернуться экспериментированию и творческому мышлению.

Заключение (от когнитивного психолога)

Я психолог, изучающий мышление и возможности его развития. При том что я с увлечением погружаюсь во все представленные выше области, меня интересует здесь ещё и важная психологическая, человеческая проблема. Это то, как люди познают, понимают, включают в свою деятельность уже имеющиеся (например, природные) и создают новые сложные системы (технические, биологические, социальные). Это системы, в том числе со взаимодействиями по принципу «камень—ножницы—бумага» — принципу вполне фундаментальному, как выяснилось в последние десятилетия, несмотря на его игровую формулировку.

Дело в том, что есть множество психологических исследований, в которых изучается, как человек с раннего детства осваивает противоположный принцип — принцип транзитивности (если первое больше второго, второе больше третьего, то первое больше третьего: если 5 > 4 и 4 > 3, то 5 > 3). Более того, создаются искусные тестовые задачи-головоломки, провоцирующие тестируемого человека сделать выбор по принципу «камень—ножницы—бумага» — ошибочный выбор, поскольку эти задачи построены на таком материале, где действует как раз правило транзитивности. И высший балл за них получает соответственно тот, кто дал ответ по этому правилу. Но почти нет психологических исследований того, как человек принимает решение в сложных «нетранзитивных» средах — там, где объективно работает принцип «камень—ножницы—бумага» и где ошибка — это как раз решение по «школьно» усвоенному правилу транзитивности.

Аналогична ситуация с обучением: есть довольно много педагогических разработок, позволяющих научить (например, ребёнка) «школьному» правилу транзитивности. Но при этом крайне мало обучающих материалов (даже в математических школах есть скорее островки таких материалов), помогающих человеку понять нетранзитивность и, шире, соотношение транзитивности и нетранзитивности в разных областях и ситуациях. Как можно разобраться и понять: мы, ставя и решая некую проблему, находимся в одной из «транзитивных» сред или же в какой-то из «нетранзитивных»? Как мыслить и действовать дальше в соответствии с этим пониманием? Таких исследований нет. Они впереди.

Комментарии к статье

* Сингх С. Симпсоны и их математические секреты. — М.: Манн, Иванов и Фербер, 2016, с. 17.

** Мельников Б., Радионов А. Программирование недетерминированных игр // Гордон А. Г. Диалоги. — М.: Предлог, 2005, с. 93—112.

Другие статьи из рубрики «Психологический практикум»

Портал журнала «Наука и жизнь» использует файлы cookie и рекомендательные технологии. Продолжая пользоваться порталом, вы соглашаетесь с хранением и использованием порталом и партнёрскими сайтами файлов cookie и рекомендательных технологий на вашем устройстве. Подробнее