Инструменты: вероятность выигрыша игры и серии

В прошлом месяце FanGraphs внедрила свою очень крутую систему игровых коэффициентов, которая оценивает шансы команды на победу в конкретной игре с учетом того факта, что домашние команды выигрывают примерно в 54% случаев. Пару месяцев назад я поделился с командой Hardball Times / FanGraphs инструментом, который стремился сделать в основном то же самое, но с использованием другого метода. Что ж, вот и я, наконец, со статьей, чтобы познакомить вас с этим инструментом. Для любителей теории вероятностей я добавляю второй свой инструмент, который дополняет первый, выясняя, что означает вероятность победы конкретной игры для общих шансов команды на победу в серии. Коэффициенты игры FanGraphs учитывают 54-процентное преимущество домашнего поля (HFA), просто добавляя 4 процента к шансам домашней команды на победу. Это имеет смысл, если обе команды полностью средние по лиге.Команды на уровне 500, поскольку 54% HFA - это средний показатель по лиге. Но если довести дело до смехотворной крайности, нельзя ожидать, что команда хозяев выиграет 97 процентов времени, не учитывая преимущество своего поля, в 97 процентах + 4 процента = 101 процент времени. Конечно, нереально ожидать, что одна команда высшей лиги побьет еще 97 процентов времени - я полагаю, даже Астрос может побеждать команду All-Star более чем в 3 процентах случаев. Даже в этом случае вы можете видеть, как будет уменьшаться отдача от преимущества домашнего поля в сторону крайностей. Вот почему я думаю, что есть более точный (хотя и более сложный) способ произвести расчеты, чем просто добавить четыре процента к шансам хозяев поля. Я считаю, что это может быть формула отношения шансов.Но если довести дело до смехотворной крайности, нельзя ожидать, что от домашней команды, которая выиграет 97 процентов времени, прежде чем будет учтено преимущество домашнего поля, будет 97 процентов + 4 процента = 101 процент времени. Конечно, нереально ожидать, что одна команда высшей лиги побьет еще 97 процентов времени - я полагаю, даже Астрос может побеждать команду All-Star более чем в 3 процентах случаев. Тем не менее, вы можете видеть, как будет уменьшаться отдача от преимущества домашнего поля в сторону крайностей. Вот почему я думаю, что есть более точный (хотя и более сложный) способ произвести расчеты, чем просто добавить четыре процента к шансам хозяев поля. Я считаю, что это может быть формула отношения шансов.Но если довести дело до смехотворной крайности, нельзя ожидать, что от домашней команды, которая выиграет 97 процентов времени, прежде чем будет учтено преимущество домашнего поля, будет 97 процентов + 4 процента = 101 процент времени. Конечно, нереально ожидать, что одна команда высшей лиги побьет еще 97 процентов времени - я полагаю, даже Астрос может побеждать команду All-Star более чем в 3 процентах случаев. Даже в этом случае вы можете видеть, как будет уменьшаться отдача от преимущества домашнего поля в сторону крайностей. Вот почему я думаю, что есть более точный (хотя и более сложный) способ произвести расчеты, чем просто добавить четыре процента к шансам хозяев поля. Я считаю, что это может быть формула отношения шансов.нельзя ожидать, что команда хозяев выиграет 97% времени без учета преимущества поля в 97% + 4% = 101% времени. Конечно, нереально ожидать, что одна команда высшей лиги побьет еще 97 процентов времени - я полагаю, даже Астрос может побеждать команду All-Star более чем в 3 процентах случаев. Тем не менее, вы можете видеть, как будет уменьшаться отдача от преимущества домашнего поля в сторону крайностей. Вот почему я думаю, что есть более точный (хотя и более сложный) способ произвести расчеты, чем просто добавить четыре процента к шансам хозяев поля. Я считаю, что это может быть формула отношения шансов.нельзя ожидать, что команда хозяев выиграет 97% времени без учета преимущества поля в 97% + 4% = 101% времени. Конечно, нереально ожидать, что одна команда высшей лиги побьет еще 97 процентов времени - я полагаю, даже Астрос может побеждать команду All-Star более чем в 3 процентах случаев. Даже в этом случае вы можете видеть, как будет уменьшаться отдача от преимущества домашнего поля в сторону крайностей. Вот почему я думаю, что есть более точный (хотя и более сложный) способ произвести расчеты, чем просто добавить четыре процента к шансам хозяев поля. Я считаю, что это может быть формула отношения шансов.Нереально ожидать, что одна команда высшей лиги побьет еще 97 процентов времени - я полагаю, даже Астрос может побеждать команду Матча звезд более чем в трех процентах случаев. Даже в этом случае вы можете видеть, как будет уменьшаться отдача от преимущества домашнего поля в сторону крайностей. Вот почему я думаю, что есть более точный (хотя и более сложный) способ произвести расчеты, чем просто добавить четыре процента к шансам хозяев поля. Я считаю, что это может быть формула отношения шансов.Нереально ожидать, что одна команда высшей лиги побьет еще 97 процентов времени - я полагаю, даже Астрос может побеждать команду Матча звезд более чем в трех процентах случаев. Даже в этом случае вы можете видеть, как будет уменьшаться отдача от преимущества домашнего поля в сторону крайностей. Вот почему я думаю, что есть более точный (хотя и более сложный) способ произвести расчеты, чем просто добавить четыре процента к шансам хозяев поля. Я считаю, что это может быть формула отношения шансов.Вот почему я думаю, что есть более точный (хотя и более сложный) способ произвести расчеты, чем просто добавить четыре процента к шансам хозяев поля. Я считаю, что это может быть формула отношения шансов.Вот почему я думаю, что есть более точный (хотя и более сложный) способ произвести расчеты, чем просто добавить четыре процента к шансам хозяев поля. Я считаю, что это может быть формула отношения шансов.

Астрос против All-Stars

Просто ради интереса: каков был бы ожидаемый результат, если бы Астрос сыграла с командой всех звезд? Ну, во-первых, каковы шансы команды Матча звезд обыграть среднюю команду лиги - другими словами, каков будет ожидаемый процент побед этой команды за сезон (или больше)? Чтобы существующие команды не теряли лучших игроков этой команде, предположим, что состав состоит из точных копий лучших игроков крупных игроков. Совершенно верно, я предполагаю, что они, вероятно, выиграют где-то от 70 до 80 процентов времени против средней команды. Пойдем с 75 процентами. Давайте также предположим, что рекорд Астроса 0,364 на момент написания этой статьи представляет их истинный процент побед, хотя на странице прогнозов FanGraphs их процент побед до конца сезона составляет более консервативное значение 0,429. Так что, если All-Stars победит.Команда 500 В 75% случаев, как часто они будут побеждать команду 0,364? Формула log5, популяризированная Биллом Джеймсом, которую использует FanGraphs Game Odds, если быть точной, скажет, что в 83,98% случаев. Это без учета преимущества домашнего поля. Если бы All-Stars были хозяевами, система FanGraphs поставила бы их шансы на победу в 87,98%; если бы они были в гостях, это снизилось бы до 79,98 процента. Мой инструмент, который вы вскоре увидите, предполагая, что HFA равен 54%, вместо этого предсказал бы, что эти репликанты выиграют 86,02% своих домашних игр против Astros против 81,70% на выезде. Разница между двумя методами составляет около двух процентов в обоих направлениях - небольшая, но заслуживающая внимания.сказал бы, что в 83,98% случаев, если быть точным. Это без учета преимущества домашнего поля. Если бы All-Stars были хозяевами, система FanGraphs поставила бы их шансы на победу в 87,98%; если бы они были в гостях, это снизилось бы до 79,98 процента. Мой инструмент, который вы вскоре увидите, предполагая, что HFA равен 54%, вместо этого предсказал бы, что эти репликанты выиграют 86,02% своих домашних игр против Astros против 81,70% на выезде. Разница между двумя методами составляет около двух процентов в обоих направлениях - небольшая, но заслуживающая внимания.сказал бы, что в 83,98% случаев, если быть точным. Это без учета преимущества домашнего поля. Если бы All-Stars были хозяевами, система FanGraphs поставила бы их шансы на победу в 87,98%; если бы они были в гостях, это снизилось бы до 79,98 процента. Мой инструмент, который вы вскоре увидите, предполагая, что HFA равен 54 процентам, вместо этого предсказал бы, что эти репликанты выиграют 86,02 процента своих домашних игр против Астроса против 81,70 процента на выезде. Разница между двумя методами составляет около двух процентов в обоих направлениях - небольшая, но заслуживающая внимания.что вы вскоре увидите, если предположить, что HFA в 54 процента вместо этого предсказывает, что эти репликанты выиграют 86,02 процента своих домашних игр против Астроса против 81,70 процента на выезде. Разница между двумя методами составляет около двух процентов в обоих направлениях - небольшая, но заслуживающая внимания.что вы вскоре увидите, если предположить, что HFA в 54 процента вместо этого предсказывает, что эти репликанты выиграют 86,02 процента своих домашних игр против Астроса против 81,70 процента на выезде. Разница между двумя методами составляет около двух процентов в обоих направлениях - небольшая, но заслуживающая внимания.

Математика

Формула отношения шансов, использование которой было предложено мне рядом саберметрических олимпийских звезд в прошлогоднем выступлении о матчах бэттер-питчеров, является одним из моих любимых инструментов в настоящее время. Это порождение знаменитой теоремы Байеса, которой дорожат многие статистики, и более сложный брат вышеупомянутой формулы log5. Преимущество формулы отношения шансов (или, по крайней мере, этого типа формулы отношения шансов) перед log5 состоит в том, что она может учитывать средние значения лиги и, следовательно, может применяться к обстоятельствам, отличным от тех, для которых был разработан log5. Что это за обстоятельство? Что ж, взгляните на формулу: log5: шанс команды A выиграть у команды B = A * (1 - B) / (A * (1 - B) + (1 - A) * B)… где «A» и «B» - соответствующие общие проценты побед Команд A и B.Теперь сравните это с отношением шансов, используемым в моих расчетах (в упрощенной версии): шанс, что команда A выиграет у команды B = 1 / (1 + B * (1-A) * (1-H) / A / H / (1-B))… где «A» и «B» - соответствующие общие проценты побед команд A и B, а «H» - преимущество домашнего поля команды A (по умолчанию HFA A составляет 54 процента, если это домашнее поле). команда, или 46 процентов при посещении). В более удобной для чтения форме:



Немного алгебры, и вы увидите, что если бы вы вынули (1-H) и H из уравнения отношения шансов, вы бы получили формулу log5. Или, если бы у вас было H = 0,5, то 1-H также равнялось бы 0,5, взаимно компенсируя друг друга, а также приводя к формуле отношения шансов, дающей тот же результат, что и log5. Вкратце, что происходит в формуле:

  • (1-A) - основной шанс проигрыша команды А
  • B - основной шанс на победу B
  • (1-H) - основная вероятность проигрыша домашней командой.

Если команда А - хозяева поля, то все три события должны произойти одновременно, чтобы команда А проиграла игру, верно? Это означает, что вы должны умножить их все, и вместе они объединятся, чтобы определить вероятность проигрыша команды А. Кстати, под «основным шансом» я подразумеваю общее среднее значение, то есть не специфичное для этого матча. Тем временем:

  • A - основной шанс на победу команды A.
  • (1-B) - основной шанс проигрыша команды B
  • H - основной шанс на победу домашней команды

Умноженная вместе, комбинация относится к шансам на победу команды А. Это означает, что в целом уравнение равно: 1 / (1 + (фактор проигрыша A) / (фактор выигрыша A)) Два фактора вместе составляют соотношение L: W для команды A. Например, если у команды A есть « истина ».620, у команды B истинный рекорд 0,550, и если преимущество домашнего поля для команды A составляет 60 процентов, то фактор проигрыша составляет около 0,0836, а фактор победы - примерно вдвое больше, при .1674. Вы можете упростить это до соотношения L: W 1: 2 (или 2: 1 W: L), или вы можете пропустить его через остальную часть формулы, чтобы преобразовать это в 66,7% -ный шанс победы A в матче. Остальная часть уравнения просто служит для преобразования отношения шансов в вероятность.Результат деления фактора проигрыша на фактор выигрыша может находиться в диапазоне от 0 (когда нет шансов проиграть) до бесконечности (когда нет шансов на выигрыш), что означает, что конечный результат общего уравнения может находиться в диапазоне только от нуля до 100 процентов. . Было ли раньше таким образом интегрировано преимущество домашнего поля в формулу отношения шансов? Я уверен, что это так, но держу пари, что вы раньше не видели удобного инструмента для этого:

Инструкции: белые клетки - это те клетки, внутри которых вы должны печатать. Начните сверху с изменения процентного соотношения «Общая победа» для Команд 1 и 2, двух команд, участвующих в матче, который вы рассматриваете. Предполагается, что эти проценты отражают истинный процент побед команды против средней (0,500) команды. Прогнозируемые цифры W% на конец сезона на FanGraph, вероятно, являются хорошим источником этих цифр. Поле непосредственно под заголовком «Домашние команды (HFA)» установлено на 54 процента, исходя из того, что домашние команды исторически выигрывали около 54 процентов матчей. Возможно, вы считаете, что у некоторых команд есть законно более высокие преимущества на домашнем поле, чем это, из-за составления состава, знакомства со стадионами и нюансами обслуживания территории или фаворитизма арбитров; Если да, то можете поиграть с числом здесь.Просто помните, что проценты должны быть больше нуля и меньше 100 процентов. Вы можете использовать что-то вроде 99,9999999 процентов, но если бы действительно можно было ожидать, что команда выиграет ровно в 100 процентах случаев, в любом случае не было бы смысла выполнять подобное упражнение с этой командой. Под рейтингом побед команд расположены столбцы с различными сценариями. В первом столбце показаны ожидаемые результаты одной игры, где команда 1 - хозяева поля; если вы хотите сделать команду 2 домашней командой в матче, вы можете изменить значение ячейки рядом с «Количество домашних игр команды 1 в серии» на 0. В выделенной ячейке по умолчанию отображается «63,78%». ожидаемый шанс Команды 1 выиграть «серию» из одной игры; здесь это шанс на победу команды 0,600 в любом конкретном матче против команды 0,500 при сохранении преимущества домашнего поля. Если это .600 команда должна была сыграть дома с командой 0,500 миллион раз, в стиле Дня сурка, можно было ожидать, что команда 0,600 выиграет около 637 800 из них. Что, если вместо этого мы говорим о шансе команды .600 выиграть домашнюю игру с тремя играми против команды .500? Это 63,78 процента? Нет, он выше - вероятность выигрыша хотя бы двух из трех составляет 70,15%, как это показывает. Давайте посмотрим на возможные способы выиграть серию и на вероятность каждого из них: W, W, W; 0,6378 x 0,6378 x 0,6378 = 0,2595 W, W, L; 0,6378 x 0,6378 x (1-0,6378) = 0,1473 Вт, Д, Ш; 0,6378 x (1 - 0,6378) x 0,6378 = 0,1473 L, W, W; (1-.6378) x .6378 x .6378 = .1473 Сложенные вместе, эти четыре способа, которыми команда .600 могла выиграть серию, в сумме дают 70,15%. Инструмент упрощает математику, используя биномиальное распределение.Однако, если шансы на победу в каждой игре в серии не одинаковы, то использование биномиального распределения на самом деле было бы чрезмерным упрощением. Но не волнуйтесь - скоро у меня будет решение. Если мы говорим о плей-офф из пяти или семи игр, то ни одна из команд не будет иметь преимущества домашнего поля в каждой игре. Таким образом, «Общая HFA для Команды 1», которую вы видите в этих сериях, является их средневзвешенным преимуществом домашнего поля. В случае пяти игроков, если он имеет 54-процентное преимущество в трех домашних играх и 46-процентное HFA (или недостаток) в двух выездных играх, это (3 x 0,54 + 2 x 0,46) / 5 = 50,8% общего HFA для серии. В последнем столбце у нас есть сезон из 162 игр, рассчитанный для команды 1. Настройка по умолчанию показывает шанс, что команда 1 выиграет не менее 100 игр за сезон.опять же с учетом того, что коэффициент побед истинных талантов у команды 1 составляет 0,600, а средний противник - команда 0,500 (что должно быть более или менее в течение сезона). График ниже будет соответствовать настройкам в этом столбце, но вы можете вручную переопределить эти настройки над графиком.

Инструмент точной разбивки серий

Этот инструмент отслеживания показывает ожидаемые результаты серии, которые являются лучшими из трех, пяти или семи игр, в зависимости от того, сколько побед необходимо команде, чтобы завершить серию (две, три или четыре, соответственно). Как и раньше, белые клетки - это те клетки, которые вы можете перезаписать.

Если шансы на победу команды в каждой игре серии одинаковы, то нет смысла использовать этот инструмент; метод биномиального распределения, используемый в первом инструменте, даст вам идентичные результаты. Однако, чтобы предоставить нелепый пример ситуации, когда использование этого инструмента даст вам гораздо более точные оценки, чем простое вычисление общего среднего выигрыша с помощью метода биномиального распределения: скажем, ваша команда состоит из андроидов Терминатора из будущего, которые разрядились батареи после пары игр серии. В серии из пяти игр у них есть 100-процентный шанс выиграть первые две игры, но нулевой шанс выиграть каждую из следующих трех. В целом, у этой команды не было бы шансов на победу в серии,верно? Если взять средний процент побед (100% + 100% + 0% + 0% + 0%) / 5 = 40% и ввести его в первый инструмент, то вы скажете, что шанс команды на победу в серии составляет 31,7%. А вот второй инструмент сделает все правильно, с нулевым процентом.

На более практическом уровне этот инструмент станет более полезным, когда с обеих сторон будут некоторые однобокие стартовые качки. Он также будет лучше учитывать любые другие существенные различия между играми, такие как преимущество домашнего поля.

Я попытался создать этот инструмент с логикой, которая может быть расширена до более длинных серий, если у кого-то из вас есть навыки работы с Excel и вы захотите сделать это сами. Инструменты можно загрузить с помощью зеленых и белых значков Excel внизу каждого.

Далее в повестке дня

[Вероятно] в будущем появится еще один инструмент, который пытается делать прогнозы на основе оценки и предотвращения бега участвующих команд, а также некоторых исторических тестов. А пока желаю счастливой статистике!