Почему средние показатели могут искажать прогнозы? Модус и медиана: важные понятия в беттинге

Обновлено:
0
Содержание

Блог букмекерской конторы Pinnacle Sports подготовил материал о влиянии средних показателей на прогнозирование спортивных событий и проблемах, которые они могут создавать для игроков. "Рейтинг Букмекеров" русифицирует материал.

Самый популярный метод обработки данных в беттинге - использование средних показателей, но является ли этот метод самым полезным? Модус и медиана зачастую лучшая альтернатива, поэтому их понимание имеет решающее значение для успешности ставок.

Проблема средних показателей для игроков в букмекерских конторах

Из-за простоты многие игроки используют средние показатели для оценки команды в статистическом выражении. Но многие ли знают об ограниченности этого метода?

Читайте также:

К примеру, делая ставки на общий тотал голов в футболе, игроки могут полагать, что высчитав среднее количество мячей, забитое за предыдущие игры, они могут предсказать точное количество голов, которое ожидается в предстоящем матче. Но действительно ли здесь уместно использование средней результативности?

В качестве примера давайте рассмотрим количество голов, забитых в английской Премьер-лиге, по сравнению с испанской Примерой в сезоне 2013/2014. Среднее количество голов за игру в этих лигах составило 2.77 и 2.75 соответственно. Эти данные могут привести игрока к мысли, что в Ла Лиге матчи чаще играются на тотал меньше 2.5, чем в АПЛ. Тем не менее это не так - 48.4% матчей в АПЛ заканчиваются на ТМ2.5, по сравнению с 47.3% в Примере.

Хотя общее распределение количества голов схоже, в АПЛ чаще всего забивают два гола за матч, а в Примере этот показатель составляет 3 гола, как можно понять по изображению ниже. Средний показатель маскирует и скрывает от нас этот факт.

Почему так происходит? Хотя средние показатели дают нам общую картину результативности, они не показывают, как распределяются голы.

Другой пример опасности использования средних показателей - при ставках на гандикапы в матчах "футбольных карликов", которые считаются мальчиками для битья в каждой отборочной кампании. Но так ли они плохи, какими их пытаются представить? Среднее количество голов в их матчах может достигать больших показателей, однако эта цифра может возникнуть в результате редких, но очень крупных поражений команды. В итоге игроки ошибаются, часто переоценивая ожидаемое количество голов в матче.

Ниже мы рассмотрим альтернативы средним показателям - модус и медиану, и используем три набора чисел и два сценария, при которых средний показатель не даст адекватную информацию.

Рассмотрим следующие наборы чисел (в каждом из них средне арифметическое равняется 5).

Набор А: 4, 5, 5, 5, 6
Набор B: 3, 4, 4, 4, 10
Набор C: 3, 4, 5, 6, 7

Первый сценарий: наличие отклонений в меньшую или большую сторону

Хотя все три набора имеют одинаковое среднее арифметическое и сумма чисел в каждом наборе равняется 25, они имеют совершенно разное распределение.

Набор А можно назвать симметрично распределенным. Два числа из пяти одинаково отклоняются в большую и меньшую стороны от среднего значения: 4 меньше 5, а 6 больше 5 на одинаковую величину.

Средняя величина идеально подходит для использования в случаях с симметричным распределением, когда отклонения от среднего значения одинаковы и происходят одинаково часто, и средняя величина находится в середине множества значений.

В противоположность подобному распределению Набор В насчитывает четыре числа меньше среднего и только одно выше. Это можно назвать асимметричным распределением.

При использовании большой базы данных игроки могут проверить пригодность среднего показателя для анализа с помощью других методов измерения - модуса и медианы.

Медиана - это значение, которое лежит в середине распределения, в порядке возрастания или убывания. В наборах А и В это число 5 и 4 соответственно.

Модус - это наиболее часто повторяющаяся величина, и в наборах А и В это также соответственно 5 и 4.

Симметричное распределение должно иметь одинаковые среднюю, медиану и модус. Разница между двумя последними величинами и средней в Наборе В говорит о том, что это несимметричное распределение, и поэтому средняя не является идеальной величиной в данном случае.

Второй сценарий: разные распространения

Два набора из нашего примера могут быть оба симметрично распределены, но не в равной степени распространяться. К примеру, Набор С симметрично распределен, как и Набор А, потому что они имеют равные величины выше и ниже средней, а также отклонение от средней одинаково в обе стороны в обоих наборах.

Тем не менее хотя средняя арифметическая в обоих наборах 5, использование средней величины является более подходящим для Набора А, поскольку он содержит большее количество чисел, равных средней величине. Разница между двумя этими наборами лежит в дисперсии в значениях каждого набора. Поэтому мы должны измерить и эту дисперсию.

Чтобы сделать это, игроки должны высчитать диапазон и стандартное отклонение. Диапазон - это разница между максимальным и минимальным значениями, вычислить диапазон совсем не сложно. С другой стороны, стандартное отклонение является более сложным показателем. В общих словах, применительно к данной статье, эта величина отражает изменение значений в наборе относительно средней величины.

Набор А и С имеют диапазоны 2 и 4 соответственно, в то время как их стандартные отклонения составляют 0.71 и 1.58. Раз обе эти величины выше в Наборе С, мы можем сделать вывод, что распространение в ней выше.

Вывод

Понимая ограниченность средних показателей, перекос распределения и различия в дисперсии, игроки окажутся в более выгодном положении, используя эти методы в прогнозировании.

Комментарии3
Аккаунт удален

Данный вид анализа наиболее пригоден для хорошего экспресса на тур одной из лиг ТОП-5, но никак ни на матчи ЛЧ. Здесь совершенно другие задачи и мотивация футболистов.

0
0
Ответить
0
Аккаунт удален

Когда я, будучи молодым, работал в одном из пунктов приема одной из популярных контор, у меня был постоянный клиент, профессор математики из университета напротив. Так вот у него были методы гораздо поизащреннее этого вашего графика).Сказать , что он выигрывал? Да нет, скорее напротив, это было похоже на наркоманию, т к, его статус и образование не позволяло ему признать ошибки его методов мат анализа. моё мнение, что каждый матч уникален (что касается тенниса) и сложно прицепить эти графики к многим спортсменам , процент из которых ставит на себя

0
0
Ответить
1
Аккаунт удален

Спасибо за отзыв!

0
0
Ответить

Популярные темы

ДЯ
Дмитрий Яриков
newbie
сегодня вносил депозит через спб, деньги человеку ушли а на счет аккаунта деньги не поступили, на по...
ВИ
Василий Иванов
newbie

Очень ждем старта новых конкурсов!

ЗЦ
Зенит ЦУПИС
bk-agent
Здравствуйте! Уточните, пожалуйста, что Вы имеете ввиду? К сожалению, не совсем поняли ситуацию, кот...
АК
Алексей Ктототамов
newbie
Аккаунт на "проверке у службы безопасности" с середины ноября. Служба поддержки не отвечает, "Предст...