Теория игр по вторникам - фон Нейман покер

Опубликовано 20 января 2015 г. Автор: Преш Талвалкар. Прочтите обо мнеили напишите мне по электронной почте.

Теперь есть компьютерная программа, которая в покере практически не имеет себе равных. Исследователи из Университета Альберты разработали алгоритм под названием Cepheus, который оптимально проигрывает техасский холдем один на один.

Покер не является полностью аналитически решаемой игрой, потому что чрезвычайно сложно рассмотреть каждую стратегию оппонента. Цефей научился хорошо играть в покер, сыграв против себя миллиард миллиардов рук - больше, чем все люди когда-либо играли. Но если вы думаете, что вы умнее, вы можете сыграть против компьютера и посмотреть, как у вас получится.

Чтобы отметить это достижение, я собираюсь описать одну из самых ранних попыток теории игр проанализировать покер. История уходит корнями в 1944 год, когда фон Нейман и Оскар Моргенштерн написали основополагающую книгу « Теория игр и экономическое поведение» (см. Мой список лучших книг по теории игр). Хотя версия покера чрезвычайно упрощена, для ее решения все же требуются некоторые усилия, и это дает представление о том, насколько сложно решить эту игру с неполной информацией. Интересно, что оптимальная стратегия предполагает важный принцип, который должен знать каждый игрок в покер.

«Все будет хорошо, если вы будете использовать свой разум для принятия решений, и думать только о своих решениях». С 2007 года я посвятил свою жизнь разделению радости теории игр и математики. MindYourDecisions теперь имеет более 1000 бесплатных статей без рекламы благодаря поддержке сообщества! Помогите и получите ранний доступ к сообщениям с обещанием на Patreon.

.

.



Упрощенные правила покера фон Неймана

В игре есть два игрока с очень ограниченными действиями. Вот правила, которые следуют описанию в этой статье Криса Фергюсона и Томаса С. Фергюсона.

Каждый игрок делает ставку в банк по 1 доллару.

Затем каждому игроку «раздается» случайное число от 0 до 1.

Игрок 1 ходит первым. Если игрок 1 «делает чек», то два числа сравниваются, и большее число выигрывает банк. Если игрок 1 «делает ставку», это означает, что в банк добавляется фиксированная сумма B долларов. Затем игрок 2 уходит.

Игрок 2 может «сбросить карты», и в этом случае игрок 1 выигрывает банк. Игрок 2 может альтернативно «уравнять», что означает сопоставить B долларов с банком. Затем два числа сравниваются, и игрок с большим числом выигрывает.

Обратите внимание, насколько ограничена эта игра по сравнению с настоящим покером. Ни один из игроков не может выбрать переменную сумму ставки, и нет возможности сделать повторный рейз. Также существует только один раунд ставок, и двум игрокам даются случайные числа, а не игральные карты, которые могут дать информацию о том, что есть у оппонента.

Тем не менее, даже эта игра дает изюминку стратегии покера. Какое решение игры?

Анализируем игру

Вот дерево игры для покера фон Неймана.

Мы должны решить игру обратной индукцией. То есть нам нужно подумать о том, что будет делать игрок 2, а затем, в зависимости от этого, мы выясним, что будет делать игрок 1.

Игрок 2 может либо «уравнять» ставку, либо «сбросить карты» и отказаться от банка. Очевидно, что для игрока 2 блефовать бесполезно. Если у игрока 2 плохая рука и он делает ставку, банк увеличивается, и числа сравниваются. В этой игре у игрока 1 просто нет возможности сбросить карты, так как игрок 2 не может повторно повысить ставку.

Таким образом, лучшая стратегия игрока 2 - коллировать только тогда, когда у него есть числа, превышающие некоторую сумму c . Ниже этой суммы при меньших числах игрок 2 захочет сбросить карты. Итак, стратегия игрока 2 такая.

Зная это, как должен играть игрок 1? Очевидно, что для хороших рук (большие числа выше числа b ) игрок 1 должен делать ставки. А для чисел среднего размера игрок 1 должен сделать чек. Но вот ключ: игрок 1 также должен делать ставки на небольшие числа ниже a . Почему? Потому что игрок 2 всегда сбрасывает карты из-за небольшого числа. Таким образом, если игрок 1 делает рейз с плохой рукой, а у игрока 2 также плохая рука, есть шанс, что игрок 1 выиграет блефом.

Следовательно, стратегия игрока 1 следующая.

Так что интуитивно они должны играть своими руками. Что в итоге?

Решение игры

Фон Нейман доказал игру натуральных киллеров игрок 1, со значением в игру в зависимости от размера ставки B .

Игрок 1 может рассчитывать на выигрыш B / [( B + 1) ( B + 4)] со следующими диапазонами ставок.

Игрок 2 объявляет только следующие руки.

Игра благоприятствует игроку 1. Если , например, B = 2, то ценность игры равна 1/9.

Замечу, что фон Нейман решил эту игру, рассматривая дискретную версию, а затем рассматривая предел. Статья Фергюсонов имеет другой вывод, основанный на принципе безразличия. Ключ в том, что каждый игрок должен безразлично выбирать варианты решения. Кроме того, любые деньги, уже находящиеся в банке, следует рассматривать как «мертвые деньги», то есть они не должны учитываться при принятии решения. Каждый игрок должен взвесить издержки и выгоды от колла по сравнению с возможностью сбросить карты (минимальный проигрыш равен 0). Вы можете прочитать технические подробности здесь.

Как вы можете видеть даже на этом очень простом примере, покер - очень сложная игра для анализа!

Добавьте к этому факторы Техасского Холдема, что игроки могут варьировать суммы ставок, есть несколько раундов ставок и игроки собирают руки с общими общими картами, и попытка решить игру становится очень сложной задачей.

Таким образом, даже несмотря на то, что компьютер, возможно, решил эту игру, сыграв миллиарды рук, определенно есть достаточно места для людей, чтобы они могли наслаждаться игрой.

Опубликовано

ПРЕШ ТАЛВАЛКАР

Я веду канал MindYourDecisions на YouTube, у которого более 1 миллиона подписчиков и 200 миллионов просмотров. Я также являюсь автором книги «Радость теории игр: введение в стратегическое мышление» и нескольких других книг, доступных на Amazon.

(Как и следовало ожидать, ссылки на мои книги ведут к их спискам на Amazon. Как партнер Amazon, я зарабатываю на соответствующих покупках. Это не влияет на цену, которую вы платите.)

Кстати, я начал вести блог Mind Your Decisions еще в 2007 году, чтобы поделиться немного математикой, личными финансами, личными мыслями и теорией игр. Это было настоящее путешествие! Я благодарю всех, кто поделился моей работой, и я очень благодарен за освещение в прессе, включая Shorty Awards, The Telegraph, Freakonomics и многие другие популярные издания.

Я изучал экономику и математику в Стэнфордском университете.

Люди часто спрашивают, как я снимаю видео. Как и многие пользователи YouTube, я использую популярное программное обеспечение для подготовки своих видео. Вы можете найти на YouTube учебники по программному обеспечению для анимации, чтобы узнать, как снимать видео. Будьте готовы - анимация отнимает много времени, а программное обеспечение может быть дорогим!

Не стесняйтесь, пришлите мне электронное письмо [электронная почта защищена]. Я получаю так много писем, что могу не отвечать, но я сохраняю все предложения для головоломок / тем для видео.

МОИ КНИГИ

Если вы совершите покупку по этим ссылкам, я могу получить компенсацию за покупки, сделанные на Amazon. Как партнер Amazon я зарабатываю на соответствующих покупках. Это не влияет на цену, которую вы платите.

Книжные рейтинги с июня 2021 года.

Mind Your Decisions- это сборник из 5 книг:

The Joy of Game Theoryпоказывает, как с помощью математики можно перехитрить своих конкурентов. (рейтинг 4.2 / 5 звезд в 200 отзывах)

«40 парадоксов в логике, вероятности и теории игр»содержат наводящие на размышления и противоречащие интуиции результаты. (рейтинг 4.1 / 5 звезд в 30 отзывах)

«Иллюзия иррациональности: какпринимать разумные решения и преодолевать предвзятость»- это руководство, в котором объясняется, насколькомы предвзяты при принятии решений, и предлагаются методы, позволяющие принимать разумные решения. (рейтинг 4/5 звезд в 17 отзывах)

В книге «Лучшие уловки с мысленной математикой»рассказывается, как можно выглядеть математическим гением, решая задачи в уме (рейтинг 4,2 / 5 звезд по 57 отзывам)

Умножение чисел на рисование линийЭта книга представляет собой справочное руководство для моего видео, которое набрало более 1 миллиона просмотров по геометрическому методу умножения чисел. (рейтинг 4.1 из 5 звезд в 23 отзывах)

Mind Your Puzzles- это сборник из трех книг «Math Puzzles», тома 1, 2 и 3. Темы головоломок включают математические предметы, включая геометрию, вероятность, логику и теорию игр.

Math Puzzles Volume 1содержит классические головоломки и загадки с полными решениями задач по счету, геометрии, вероятности и теории игр. Том 1 получил оценку 4,4 / 5 звезд в 75 отзывах.

Math Puzzles Volume 2- это продолжение книги с большим количеством серьезных задач. (рейтинг 4.3 из 5 звезд в 21 отзывах)

Math Puzzles Volume 3- третий в серии. (рейтинг 4.3 из 5 звезд в 17 отзывах)

KINDLE UNLIMITED

Учителя и студенты со всего мира часто пишут мне о книгах. Поскольку образование может иметь такое огромное влияние, я стараюсь сделать электронные книги доступными как можно шире по как можно более низкой цене.

В настоящее время вы можете читать большинство моих электронных книг через программу Amazon «Kindle Unlimited». Включив подписку, вы получите доступ к миллионам электронных книг. Вам не нужно устройство Kindle: вы можете установить приложение Kindle на любой смартфон / планшет / компьютер и т. Д. Ниже я собрал ссылки на программы в некоторых странах. Пожалуйста, проверьте свой местный веб-сайт Amazon, чтобы узнать о доступности и условиях программы.

ТОВАРЫ

Купите кружку, футболку и многое другое на официальном сайте товаров: Mind Your Decisions at Teespring.

4 мысли о «Теория игр по вторникам - фон Нейман-покер»

Ваше утверждение, что 6 миллиардов рук - это больше рук, чем сыграли люди, почти наверняка неверно. Я сыграл в покер несколько миллионов рук, и я уверен, что есть тысячи, которые сыграли больше, чем я.

Это опечатка. В связанной статье написано миллиард миллиардов, или 10 ^ 18.

Да, извините за опечатку. Вот точная цитата

«Он был натренирован против самого себя, играя в покер, эквивалентный более чем миллиарду миллиардов рук», - говорит Боулинг. «С каждой рукой он улучшал свою игру, совершенствуясь все ближе и ближе к идеальному решению. Программа обучалась в течение двух месяцев с использованием более 4000 процессоров, каждый с учетом более шести миллиардов раздач каждую секунду. Это больше покер, чем играла вся человеческая раса ». - См. Дополнительную информацию по адресу: http://uofa.ualberta.ca/news-and-events/newsarticles/2015/january/poker-playing-program-knows-when-to-fold-em#sthash.bIkwAeYG.dpuf.

Это неправда. Cepheus не играет в идеальный хедз-ап покер, он играет в идеальный хедз-ап лимитный холдем. Разница огромна: в лимитный холдем редко играют, однако безлимитный холдем один на один по-прежнему остается очень важной частью игры. Если последнее будет решено, последствия будут огромными. Вывод также неверен, фон Нейман решил только упрощенную игру.

Комментарии закрыты.

Этот сайт предназначен только для развлекательных и образовательных целей (политика конфиденциальности).