Введение в теорию игр / Deal Or No Deal

Контент

Эта статья посвящена теории игр и оптимальной стратегииигры в популярное телешоу Deal or No Deal.

Одна из основных стратегий состоит в том, чтобы участник действовал так, чтобы максимизировать ожидаемую ценность своего приза. В каждый момент игры, когда банкир делает предложение, участник может максимизировать свое ожидаемое значение, выбирая предложение, если оно превышает среднее значение неоткрытых дел, и отклоняя его, когда оно меньше. Однако предложения банкира почти никогда не превышают среднего значения неоткрытых дел. Таким образом, если бы участники всегда выбирали эту стратегию, игра была бы скучной, так как участники всегда отклоняли бы предложения и продолжали открывать дела до конца (или до тех пор, пока предложение банкира не превысит ожидаемое значение).

Однако игра становится интересной при использовании других стратегий, предполагающих оптимизацию по параметрам, выходящим за рамки ожидаемого значения. Участник, отклоняющий предложение банкира, принимает на себя риск того, что он может выиграть меньше, чем это предложение. У разных людей разная степень толерантности к риску. Например, если бы им был предложен выбор между получением 400 000 долларов или равным шансом на выигрыш 1 или 1 000 000 долларов, многие участники предпочли бы принять 400 000 долларов, несмотря на тот факт, что если бы их стратегия заключалась просто в максимальном увеличении ожидаемой стоимости, участник должен отклонить предложение. . Причина, по которой многие участники согласятся принять $ 400 000, заключается в том, что люди максимизируют полезность своих денег, а не напрямую от ожидаемой стоимости. Полезность денег уменьшается по мере того, как человек получает больше денег, например, полезность первых 400 долларов,000, которые получит участник, может стоить намного больше, чем следующие полученные 600 000 долларов.

Обманчиво простой формат игры привлек внимание математиков, статистиков и экономистов как исследование принятия решений в условиях риска: это отличный поучительный пример применения теории полезности. В 2004 году группа экономистов провела сокращенную версию игры с 84 участниками и сравнила результаты с гипотезой ожидаемой полезности. [1] Исследование привлекло большое внимание средств массовой информации: оно появилось на первой полосе The Wall Street Journal12 января 2006 года, а также было показано на Национальном общественном радио в США 3 марта 2006 года.

СОДЕРЖАНИЕ

Стратегия моделирования [править | редактировать источник]

В начале стандартной игры американской версии Deal or No Dealожидаемая стоимость игры составляет $ 131 477,54, среднее значение из 26 случаев. Однако только 6 из 26 случаев имеют значения, превышающие ожидаемое значение, а среднее значение из 26 случаев составляет всего 875 долларов США. Прежде чем будет предложена какая-либо сделка, участник должен выбрать 6 случаев, которые будут исключены. Таким образом, ожидаемая стоимость кейсов на момент первого предложения может варьироваться от минимума в 13 420,80 долларов США до максимума в 170 916,25 долларов США, а среднее значение - от минимума в 350 долларов США до максимума в 17 500 долларов США, что приводит к значительному изменению игровых условий со стороны игроков. время, когда игроки должны сначала принять решение в игре.

Перспектива банкира [править | редактировать источник]

Не следует учитывать только точку зрения участника, который выиграет приз, так как это игра для двух игроков, а банкир - это другой игрок. Поскольку банкир играет в большое количество игр, что значительно снижает его риск, он может быть чрезвычайно терпимым к остающемуся риску и принять стратегию, направленную на минимизацию ожидаемой стоимости призов, которые выиграют участники. Однако ожидаемое значение, которое он стремится минимизировать, зависит не от каждой игры, как в случае с участником, а от расчета на час игры. Стратегия, которая заставит среднего участника играть в течение часа и выиграть 100 000 долларов, более выгодна для банкира, чем стратегия, при которой средний участник будет играть всего четверть часа и выиграть 50 000 долларов. Это помогает объяснить, почему банкир 'Первые несколько предложений - это лишь небольшая часть ожидаемой стоимости оставшихся случаев. Оптимальный банкир будет делать предложения, которые, с его точки зрения, улучшают ожидаемую стоимость часа игры. С точки зрения участника, это становится премией, которую он должен заплатить за досрочное завершение игры.

Взгляд участника [править | редактировать источник]

Обычно участник вступает в игру с представлением о том, что он считает минимально удовлетворительным призом. Пока участник может продолжить игру без значительного риска выбить все призы сверх этого минимума, он будет делать это. То, что участник считает удовлетворительным, может измениться во время игры по мере изменения оставшихся призов. Например, когда второй по величине оставшийся приз составляет 75 000 долларов, участник будет более удовлетворен риском того, что он может стать самым ценным оставшимся призом, если текущий самый ценный оставшийся приз составляет 100 000 долларов, чем если бы он составлял 1 000 000 долларов. Таким образом, игрок, скорее всего, захочет продолжить игру, пока риск невелик. К моменту четвертого предложения осталось восемь дел. На данный момент в игре есть только 4.Вероятность 8%, что участник выберет все призы на сумму 100 000 долларов и более, и вероятность 72,8%, что в игре останется как минимум два таких приза. Следовательно, участник также вряд ли примет раннее предложение.

Начало игры

В начале игры участнику разрешается выбрать один кейс. Вероятность фактического выбора кейса за 1 000 000 долларов составляет 3,85%. Интересно отметить, что многие участники действительно считают, что они выбрали кейс за 1 000 000 долларов, хотя шансы не выбрать кейс на миллион долларов составляют 96,15%. Многие из этих участников принимают решения, полагая, что они выбрали кейс на миллион долларов (или один из пяти других более ценных кейсов). По ходу игры это обычно заставляет участника брать на себя ненужный риск и не принимать предложение банкира, даже если предложение может быть выше, чем ожидаемый результат средней стоимости оставшихся дел. Этот феномен человеческого поведения (т. Е. Заблуждение) почти всегда работает против соперника.

Конец игры [править | редактировать источник]

Желательность продолжения игры уменьшается для обоих игроков, поскольку количество призов, удовлетворяющих участника, оставшегося в игре, уменьшается. При меньшем количестве призов, которые участник считает удовлетворительными, риск для участника возрастает. Этот повышенный риск снижает процент оценочной стоимости оставшихся случаев, когда предлагаемая сделка должна быть привлекательной для участника. И наоборот, банкир, поскольку он пытается также оптимизировать развлекательную ценность игры, может нуждаться в быстром завершении игры, если значения всех остальных случаев малы. Чтобы завершить игру, ему нужно увеличить процент оценочной стоимости оставшихся кейсов, которые он предлагает для сделки, иногда даже выше оценочной стоимости.

Сравнение с проблемой Монти Холла [править | редактировать источник]

Когда остается только три случая, « Сделка» или «Нет сделки»может показаться версией проблемы Монти Холла. Рассмотрим игру « Сделка» или «Нет сделки»с тремя кейсами (похожими на три двери в задаче Монти Холла). У конкурсанта есть одно дело. Затем открывается одно из двух других дел. Наконец, участнику предоставляется возможность обменять его или ее дело на одно оставшееся неоткрытое дело.

Задача Монти Холла дает участнику 2/3 шанса на победу с переключением и 1/3 шанса на победу, если оставит свое дело. Однако между « Давайте заключим сделку»и « Сделка или нет»есть принципиальная разница . В задаче Монти Холла ведущий использовал свои секретные знания о том, что скрывается за каждой из трех дверей, чтобы всегда обнаруживать плохой выбор. Этот неслучайный выбор плохого выбора является причиной разницы в шансах на выигрыш между переключением и отказом от Let's Make a Deal. Это заставляет Let's Make a Dealвести себя как проблема Невежественного Монти Холла.

Анализ принятия решений в условиях риска [править | редактировать источник]

Команда экономистов - Пост, Ван ден Ассем, Балтуссен и Талер (отчет) - проанализировали решения людей, фигурирующих в разделе « Сделка» или «Нет сделки»,и, среди прочего, обнаружила, что участники менее склонны к риску, когда видят свой ожидаемый выигрыш. кувыркаться. «Проигравшие», как правило, продолжают играть в игру, даже если это означает отклонение предложений банка, превышающих среднее значение оставшихся призов. Отдельное экспериментальное исследование (отчет) с учащимися-испытуемыми, играющими в игру с уменьшенными призами, показывает аналогичную картину. Полученные данные поддерживают бихевиористских экономистов, которые утверждают, что классическая теория ожидаемой полезности не в состоянии объяснить человеческое поведение, не принимая во внимание контекст принимаемых решений. Исследование четырех экономистов уникально, так как лежащий в основе «эксперимент»Deal or No Dealхарактеризуется высокими ставками, прозрачным распределением вероятностей и только простыми решениями, которые требуют минимальных навыков или стратегии.

Это конкретное исследование недавно привлекло внимание средств массовой информации в Соединенных Штатах, в том числе на первой полосе Wall Street Journalот 12 января 2006 г. и National Public Radio от 3 марта 2006 г.