Среднее значение, мода и медиана – ключевые понятия для размещения ставок

Самый популярный способ оценки данных при размещении ставок заключается в использовании среднего значения, но приносит ли он максимум пользы? Мода и медиана обычно являются более подходящей альтернативой, поэтому крайне важно разобраться в этих понятиях для успешного размещения ставок.

564352342

Трудности при использовании среднего значения для игроков

Многие игроки, делающие ставки на спорт, используют среднее значение для статистического расчета результатов. Это довольно простой способ. Но многие из них знают о его недостатках?

Например, при размещении ставок на общее количество голов в футболе игроки могут придерживаться того мнения, что подсчет среднего количества голов, забитых во время предыдущих игр, позволяет точно определить ожидаемое число голов для следующего матча. Но так ли эффективен подсчет со средними значениями?

Хотя среднее значение и дает общее представление о ситуации, при этом не учитывается форма распределения.

Например, сравним количество голов, забитых в рамках лиг Premier League и La Liga на протяжении сезона 2013/2014 гг. Среднее количество голов из расчета на одну игру для каждой лиги составляет 2,77 и 2,75 соответственно. В итоге игроки могут прийти к выводу о том, что игры в рамках La Liga чаще заканчиваются с результатом, не превышающим 2,5 гола, по сравнению с EPL. Однако это не так – 48,4 % игр EPL приносят меньше 2,5 гола. Аналогичный показатель для La Liga составляет 47,3 %.

На нижеприведенной диаграмме видно, что при одинаковом числовом распределении для лиги Premier League чаще всего достигается результат в два гола за игру, а для La Liga – три гола. Среднее значение скрывает этот факт.

averages-insert.jpg

Почему происходит именно так? Хотя среднее значение и дает общее представление о ситуации, при этом не учитывается форма распределения.

Средние величины рискованно использовать, например, при оценке гандикапов для слабых сборных во время международных футбольных турниров, которые считаются аутсайдерами, для каждого квалификационного раунда. Но так ли плохо обстоят дела в действительности? При вычислении среднего количества голов сборных за одну игру можно получить большие итоговые показатели, но они могут существенно измениться с учетом более редких серьезных поражений и привести к тому, что игроки переоценят ожидаемое количество голов.

Ниже приведен анализ альтернатив среднему значению (мода и медиана) с использованием трех наборов чисел для рассмотрения двух вариантов развития событий, при которых среднее значение может стать неприемлемым.

Рассмотрим нижеприведенные наборы чисел (среднее значение каждого из них: 5).

  •        Набор А: 4, 5, 5, 5, 6.
  •        Набор Б: 3, 4, 4, 4, 10.
  •        Набор В: 3, 4, 5, 6, 7.

Первый вариант развития событий. Резко отклоняющиеся значения в начале и в конце

Хотя три набора чисел характеризуются одинаковым средним значением и в сумме дают 25, их распределение довольно различное.

Набор A можно отнести к симметричному распределению (равномерный показатель в начале и в конце, поскольку 4 ниже среднего значения, а 6 – выше).

Среднее значение – это идеальный вариант при наличии симметричного распределения, когда значения переменных возникают с одинаковой частотой в начале и в конце указанного набора. Среднее значение приведено посередине набора.

В свою очередь, набор Б содержит четыре числа ниже среднего значения – только одно число превышает среднее значение. В данном случае возникает несимметричное распределение.

Разобравшись в недостатках метода с использованием среднего значения, игроки смогут принимать более взвешенные решения относительно его применения при прогнозировании результатов.

При использовании большого набора данных игроки могут проверить эффективность среднего значения с помощью других показателей – медианы и моды.

Медиана – это значение, занимающее среднее положение в распределении при группировке в возрастающем или убывающем порядке. В последовательностях А и Б это 5 и 4 соответственно. Мода – это наиболее часто встречающееся значение – 5 и 4 соответственно.

При симметричном распределении среднее арифметическое, медиана и мода должны быть одинаковыми. Различие между двумя последними значениями и средним арифметическим в наборе Б указывает на то, что это несимметричное распределение, и, следовательно, среднее значение – не самый лучший вариант в этом случае.

Второй вариант развития событий. Различный разброс значений

Два набора чисел могут быть симметрично распределены, имея различный разброс значений. Например, набор В симметрично распределен, как и набор А, из-за равномерного уменьшения или повышения чисел в начале и в конце набора с учетом среднего значения.

Поскольку в итоге мы получаем среднее значение, равное 5, это среднее значение больше подходит для набора А, поскольку он содержит больше чисел, более близких к среднему арифметическому. Разница между двумя наборами состоит в разбросе значений в группе. Поэтому необходимо определить разброс значений.

С этой целью игроки могут рассчитать размах и среднеквадратическое отклонение. Размах – разность между максимальным и минимальным значениями – можно легко рассчитать. С другой стороны, вычисление среднеквадратического отклонения – это более сложная задача. В этой статье достаточно указать, что таким образом определяется вариация в наборе данных с учетом среднего значения. Следует отметить, что в дальнейшем будет составлена статья с более подробными сведениями о распределениях и среднеквадратическом отклонении.

Величина размаха для наборов А и В составляет 2 и 4, а среднеквадратическое отклонение – 0,71 и 1,58 (соответственно). Обе величины больше для набора В – это еще один показатель того, что в последней группе наблюдается более существенное различие.

Вывод

Разобравшись в недостатках метода с использованием среднего значения (несимметричные распределения и различный разброс значений), игроки смогут принимать более взвешенные решения относительно его применения при прогнозировании результатов. Тщательный анализ применимости среднего значения не был проведен, однако представленных данных должно быть достаточно для предостережения и напоминания о других показателях.

sportstatist.com

Источник: pinnacle.com