Сюрпризы и потрясения. Насколько удивительным получился чемпионат мира-2022?
Можно ли считать абсолютной неожиданностью победу Саудовской Аравии над Аргентиной на чемпионате мира по футболу в 2022 году в Катаре? А победы японцев над немцами и испанцами? Известный эксперт БК Pinnacle Джозеф Бухдаль попытался разобраться, являются ли сенсации на крупных турнирах настолько неожиданными, как считают болельщики и игроки на ставках?
Согласно данным компании Gracenote, которая обрабатывает спортивные метаданные, ивент в Катаре стал соревнованием для аутсайдеров, ведь 15 матчей завершились сюрпризами, и такое количество оказалось наибольшим процентным значением за 64 года. Насколько удивительно это число и как мы можем на деле определить, что стоит расценивать как сюрприз?
Наверное, многие считают победу Японии над Испанией и Германией, а также победу Саудовской Аравии над Аргентиной сенсациями, однако эти умозаключения опираются на то, насколько тверды наши убеждения в том, что испанцы, немцы и аргентинцы должны были победить в тех матчах. На интуитивном уровне можно предполагать, что ответ очевиден. Однако, поскольку истинные вероятности различных исходов невозможно знать наверняка, нам всегда стоит учитывать возможное наличие ошибок.
Если результаты матча выглядят неожиданными, можно ли утверждать, что аутсайдеру (получившему свой статус благодаря точной прогнозной модели) просто повезло? Или, быть может, андердог на самом деле не был аутсайдером и в прогнозной модели нашелся изъян? Эта загадка весьма интересна с философской точки зрения, но отыскать на нее ответ будет весьма тяжело. Нам придется работать с двумя типами неопределенности.
Неопределенность или ошибку в прогнозной модели называют «эпистемической неопределенностью», и обычно ее влияние можно уменьшить благодаря более точному моделированию. Если же проблемы лежат в менее очевидной плоскости, то мы имеем дело с так называемой случайной неопределенностью, которую в быту называют шансами, удачей или просто случайностью.
Уменьшить этот вид неопределенности невозможно. Отделить эпистемическую неопределенность от случайной может быть трудно. В этой статье мы попытаемся немного упростить задачу для бетторов. В частности, попытаемся исследовать фактор неожиданности для Катара-2022 в целом.
Вероятности для комбинированной ставки на 64 матча
Если мы оценим вероятности каждого из трех возможных результатов для каждого 90-минутного матча Катара-2022, нам удастся составить вероятность для комбинированной ставки на 64 матча с учетом всех возможных комбинаций исходов. Но какие вероятности исходов нам следует использовать?
Наиболее амбициозные бетторы наверняка имеют собственные методы подсчета, однако с целью экономии времени, а также зная о том, что эти коэффициенты считаются одними из наилучших, мы будем использовать для матчей предполагаемые котировки линии закрытия от Pinnacle.
Ранее я неоднократно и подробно объяснял, почему коэффициенты линии закрытия БК являются одними из наиболее выгодных для оценки исходов с истинной вероятностью. Да, букмекер добавляет к этим показателям маржу, так что сперва нам придется ее вычесть. Для этого у нас есть свой собственный калькулятор. Мы можем использовать эти вероятности для комбинированных ставок, чтобы попытаться ответить на вопрос: насколько неожиданными являются совокупные результаты чемпионата мира-2022?
Нарративное заблуждение
Некоторое время уйдет на осознание, что вероятность полного отсутствия сюрпризов в 64 матчах чемпионата мира исчезающе мала. Шанс, что все фавориты матчей оказались бы победителями, составляет лишь 11%. Используя коэффициенты линии закрытия Pinnacle, можно рассчитать: для результатов матчей после 90 минут нам подходят 6,5 × 10–17 исходов, или же немногим более одного к миллиону триллионов.
Если бы подобное действительно случилось, это стало бы одним из наиболее потрясающих событий в истории человечества. Тем не менее я все еще задумываюсь над тем, многие ли люди (кроме любителей статистики) придали бы этому хотя бы какое-то значение. Быть может, они просто отметили бы, что очередной чемпионат мира выдался крайне скучным.
У любой другой комбинированной ставки для 64 матчей (а таких может быть много – три в 64-й степени, или же 3 433 683 820 292 512 484 657 849 089 281) вероятность успеха гораздо ниже. В каждой из них будем учитывать различные сюрпризы (сюрпризом мы будем считать такой исход, при котором ожидаемого результата не случилось), и чем меньше вероятность успеха у комбинированного пари, тем больше в ней предусмотрено сюрпризов.
Впрочем, мы не будем иметь дела с сюрпризами лишь в одном случае: все ожидаемые исходы должны произойти. Однако сюрпризы могут случаться различными способами. Пусть по отдельности вероятность комбинированной ставки для 64 матчей с сенсациями может быть небольшой, однако хотя бы какой-то из сюрпризов случится с гораздо большей вероятностью, чем полное отсутствие неожиданностей.
Рассмотрим простой биномиальный пример из 10 матчей с двумя возможными исходами, в которых каждый фаворит может победить с вероятностью 80%, а аутсайдер – с вероятностью 20%. Все фавориты вместе победят с вероятностью 11%, однако у нас есть 20-процентная вероятность того, что победят три андердога, а с 9-процентной вероятностью могут победить уже четыре аутсайдера.
Почему эта вероятность настолько высока? Отдельные вероятности каждого такого события составляют 0,17% и 0,04% (для каждого конкретного набора из трех или четырех аутсайдеров), но мы имеем дело с огромным количеством комбинаций аутсайдеров: 120 вариантов для победы трех из них и 210 вариантов для победы четырех.
Проще говоря, сюрпризы ожидаемы. Они будут. Очень часто наши мозги стремятся создавать на основе данных простые истории (которые иногда будут содержать изъяны), чтобы придать смысл миру, в котором сюрпризы считаются более неожиданными, чем они есть на самом деле.
Когда Япония не обыгрывает Испанию и Германию, мы не пишем истории, но статистика говорит: неожиданные исходы – это статистическая данность. Это и есть пример нарративного заблуждения.
Распределение вероятностей по методу Монте-Карло
Комбинированную ставку для 64 матчей с вероятностью 6,5 × 10–17 можно рассматривать лишь одним образом. Наименее вероятная комбинированная ставка, предполагающая победу всех аутсайдеров, обладает вероятностью 1,5 × 10–51, и случиться соответствующий исход может лишь одним способом. Но каким числом способов мы сможем сформировать вероятности комбинированных ставок величиной 10–25 или 10–30?
Алгоритмическая обработка таких расчетов окажется для нас слишком сложной. Для упрощения вычислений лучше модель на базе метода Монте-Карло. Сгенерировав случайным образом исходы матчей в соответствии с предполагаемыми вероятностями Pinnacle, мы можем составить вероятность для случайно сгенерированной комбинированной ставки на 64 матча.
Повторим эту процедуру большое количество раз, подсчитаем, как часто встречается каждая из предопределенных вероятностей, и мы сможем составить частотное распределение вероятностей. То есть у нас есть возможность определить величину и частоту встречаемости вероятностей возможных исходов для 64 матчей ЧМ-2022.
Впрочем, работу над крошечными вероятностями достаточно сложно вести на интуитивном уровне. Еще можно применить несложное преобразование, чтобы на когнитивном уровне справиться с этими вероятностями было проще: давайте рассчитаем логарифмы. Логарифм (с основанием 10) для 0,001, например, равен –3; для 0,000001 он равен –6, а для 0,000000000001 мы получим результат –12. В своих целях мы вовсе будем использовать натуральный логарифм (ln с основанием e), а еще отбросим минус перед результатом.
В рамках модели на основе метода Монте-Карло мы выполнили 100 000 симуляций для 100 000 значений натурального логарифма каждой вероятности случайно сгенерированной комбинированной ставки для 64 матчей (с отбрасыванием минуса). Все результаты мы разобьем на подгруппы, а затем составим частотную диаграмму распределения (или же встречаемости).
Шкала оси X для этой диаграммы ограничена значениями 37,3 (для победы всех 64 фаворитов) и 117,1 (для победы всех аутсайдеров), однако мы уже знаем: встречаемость соответствующих исходов крайне мала.
Для оценки диапазона вероятностей нужно отобразить только наиболее вероятные исходы. На диаграмме можно увидеть, что с наибольшей частотой значение комбинированной ставки для 64 матчей значение по оси X будет располагаться между 45 и 75. Эти значения соответствуют вероятностям комбинированных ставок, примерно равным 3 × 10–20 и 3 × 10–33 соответственно.
Вероятность для комбинированной ставки уменьшается по мере смещения вправо по оси X. Средний (или наиболее часто встречаемый) исход для комбинированной ставки на оси X располагается примерно напротив 60, что соответствует вероятности комбинированной ставки величиной 7,5 × 10–27.
На диаграмме также можно увидеть вертикальную черную линию, которая расположена на значении оси, соответствующем реальному исходу комбинированной ставки на чемпионат мира, которая оказалась бы выигрышной. Это значение на оси X равно 63,5 (а вероятность успеха для комбинированной ставки равна 2,7 × 10–28). Такое значение примерно в 28 раз меньше, чем большинство наиболее вероятных исходов для комбинированной ставки.
Звучит впечатляюще, но диаграмма свидетельствует: ничего необычного не происходит. Вы можете заметить, что это значение располагается недалеко от центра (усредненного показателя) частотного распределения. Лишь около 20% возможных вероятностей комбинированных ставок на Катар-2022 соответствовали меньшие значения, чем то, которое расположилось напротив вероятности победной ставки.
С точки зрения статистики мы не можем назвать такой исход сюрпризом. Для сюрприза нам пришлось бы сместить вертикальную линию на равное 70 значение оси X (по крайней мере), и тогда вероятность такого исхода попадала бы менее чем в 1% возможных комбинированных ставок. Этот исход соответствовал бы вероятности комбинированной ставки величиной 4 × 10–31, то есть она почти в 700 раз меньше вероятности реально сложившегося исхода. В рамках такого исхода, например, Катар мог победить Нидерланды, Польша взять верх над Францией, а Бразилия уступить Южной Корее.
Стал ли Катар-2022 удивительным?
Изучив представленные в статье данные, мы можем ответить на изначальный вопрос. ЧМ-2022 не стал удивительным. Да, в отдельно взятых матчах были сюрпризы, однако, как мы уже знаем, такое регулярно случается в турнирах, предполагающих множество игр. Куда удивительнее, если бы сюрпризов в Катаре не произошло. Впрочем, что именно следует считать удивительным? Наверное, ответ на этот вопрос зависит от наших ожиданий от исходов матчей.
Предположим в качестве крайности, что Уэльс являлся очевидным фаворитом в матче с Англией, а Португалия считалась андердогом во встрече с Ганой, а Австралия была обязана побеждать Францию. Получается, что итоговые результаты этих матчей нас удивили. Случилось ли так из-за того, что аутсайдерам (по мнению модели) повезло, или же наша прогнозная модель просто ошиблась? Ответ очевиден, однако обычно грань между первым и вторым вариантами оказывается куда более размытой.
Оценки вероятностей исходов для матчей со стороны Pinnacle также не полностью предугадали события. Это тоже можно отнести к невезению или к ошибке модели. И определить правильный ответ в таком случае будет куда сложнее. Поскольку статистически существенных различий между ожиданиями Pinnacle и реальными событиями не наблюдалось, у нас есть веские основания полагать: прогнозная модель не так уж и плоха.
Получается, чемпионат мира (с точки зрения Pinnacle) нельзя назвать слишком удивительным на основании статистики. Результат прошедшего ивента был менее вероятен, чем наиболее вероятный исход (вероятно, тогда мы бы увидели на два-три сюрприза меньше), однако разница оказалась невелика. Если бы со статистической точки зрения разница оказалась более существенной, нам было бы проще оспорить мнение БК.
Сформулируем правило: чем больше разница между ожиданием и реальностью, тем выше статистическая вероятность того, что наша модель ожиданий оказалась неправильной. Превосходит ли прогнозная модель для матчей чемпионата мира авторства Pinnacle модели других букмекеров? Об этом мы поговорим отдельно.
Бонусы для вас
Сохрани РБ в избранное