Закон малых чисел в спортивных ставках


Закон малых чисел: неоправданные заключения на основе недостаточной информации. Читайте дальше, чтобы проверить свои навыки логического мышления, ответив на загадку о больницах, и выяснить, как графики могут ввести в заблуждение и что можно сделать во избежание убытков при размещении ставок с использованием статистических данных. 

Загадка о больницах

В 1974 г. два психолога Даниэль Канеман (Daniel Kahneman) и Амос Тверски (Amos Tversky) провели эксперимент, в котором испытуемым описывали некую ситуацию и задавали вопрос. Вот эта ситуация. В одном городе работают две больницы. В большой больнице каждый день рождается примерно 45 младенцев, а в маленькой больнице – примерно 15 младенцев.

Известно, что около 50 % всех новорожденных – мальчики. Однако точное соотношение меняется изо дня в день. Иногда мальчиков рождается больше 50 %, иногда меньше. В течение одного года в обеих больницах отмечали дни, когда количество новорожденных мальчиков превышало 60 %. В какой больнице, по-вашему, таких дней больше?

  •        В большой больнице.
  •        В маленькой больнице.
  •        Примерно одинаково (разница не более 5 %).

Если верить теории биномиального распределения, то количество дней, когда рождалось как минимум на 4–6 мальчиков больше, чем девочек, будет почти в три раза больше в маленькой больнице только за счет более ярко выраженной волатильности показателей рождаемости. Распределение в большой выборке, скорее всего, будет реже отклоняться от 50 %. Тем не менее только 22 % респондентов дали правильный ответ.

Что такое эвристика?

Канеман и Тверски объяснили, что подобное ошибочное представление обусловлено верой людей в закон малых чисел. Если говорить в общем, то выводы, сделанные на основании данных малых выборок, часто неверно считаются репрезентативными для более широкой совокупности. Например, малая выборка, которая, как представляется, распределена по случайному закону, укрепит убежденность в том, что более широкая совокупность, к которой она относится, так же будет распределена случайным образом.

Загадка о больницах: распределение в большой выборке, скорее всего, будет реже отклоняться от 50 %. Тем не менее только 22 % респондентов дали правильный ответ.

С другой стороны, малая выборка, позволяющая выявить кажущиеся очевидными закономерности (например, выпадение девяти «орлов» в серии из 10 бросков монеты) даст наблюдателю основания полагать, что такая же тенденция будет прослеживаться и в совокупности. В этом случае можно предположить, что монета «предвзята», то есть исходы ее бросков не могут считаться справедливыми. Восприятие, заключающееся в способности видеть закономерности в случайных или бессмысленных данных, называется апофенией.

Вера в закон малых чисел относится к более широкой группе ментальных приемов, к которым люди прибегают при принятии решений в условиях неопределенности. Канеман и Тверски назвали эти приемы эвристикой. Обобщения, сделанные на основании малых выборок, являются примером эвристики репрезентативности, когда люди оценивают вероятность того или иного события, ориентируясь исключительно на обобщение данных о предыдущих подобных событиях, которые сразу приходят на ум.

Другим примером эвристики репрезентативности является ложный вывод азартного игрока. Действительно, такая предвзятость возникает из-за веры в закон малых чисел. Канеман и Тверски говорили следующее:

«Суть проблемы ложного вывода азартного игрока заключается в неверном представлении о справедливости законов случайности». Игрок считает, что в случае с монетой закон справедливости будет действовать таким образом, что отклонение от ожидания выпадения одной стороны монеты в скором времени будет устранено за счет отклонения от ожидания в отношении выпадения другой стороны монеты. Люди действуют так, как будто каждый элемент случайной последовательности позволяет реально оценить истинную пропорцию совокупности; если последовательность отклонилась от пропорции генеральной совокупности, следует ожидать, что произойдет корректирующее смещение в обратном направлении.

Чтение графиков для выборок неравных размеров

Игроки, делающие ставки на спорт, особенно подвержены ошибкам при выявлении закономерностей по причине необоснованной веры в закон малых чисел. Неправильная оценка рентабельности на основании результата анализа малой выборки ставок и его восприятие как репрезентативного показателя отклонения от случайности и подтверждения прогностических умений может привести к неприятным финансовым последствиям в долгосрочной перспективе. Рассмотрим приведенный ниже график гипотетической рентабельности 100 ставок на разницу в счете игр NFL. Все ставки сделаны с коэффициентом 1,95. Впечатляет, не так ли?

gr-small-numbers-1.jpg

А как вы отреагируете, если узнаете, что это график составлен по данным о ставках известного спортивного гандикапера из США? Ваша доверчивость вполне понятна, ведь динамика достаточно хорошая, а доход составляет 15 %. Но это, конечно же, неправда. На самом деле, следующий график по 1000 ставок позволяет получить более полное представление о ситуации.

gr-small-numbers-2.jpg

В действительности долгосрочная рентабельность полностью отсутствовала. Причина заключается в том, что эти данные были получены с помощью генератора случайных чисел, который позволил определить, что вероятность индивидуальной победы равна 50 %, а ожидание прибыли –2,5 %. На первом графике просто представлены первые 100 ставок второго графика.

Но даже во второй более длительной серии ставок положительная динамика рентабельности сохранялась в течение нескольких сотен ставок. Кроме того, несмотря на то что наблюдается общая убыточность, закономерность, присущая элементам этой временной последовательности, не является случайной и имеет в меру стабильную волнообразную динамику.

Однако, как признали Канеман и Тверски, люди гораздо более склонны считать, что последовательности похожих результатов неслучайны, даже если для этого нет никаких оснований. Какая из двух приведенных ниже двоичных последовательностей выглядит случайной, а какая неслучайной?

0, 0, 0, 0 1, 1, 1, 1, 0, 0, 1, 1, 0, 0, 1, 1, 1, 1, 1, 1
0, 1, 1, 0, 1, 0, 0, 0, 1, 1, 0, 0, 1, 0, 1, 0, 0, 1, 1, 1

 

Большинство людей выберет вторую последовательность. На самом деле, первая последовательность сгенерирована случайным образом в Excel, а вторая была специально сформирована таким образом, чтобы отрезки с «1» и «0» были короче. Если попросить людей сформировать случайные последовательности, которые были бы похожи на приведенные выше примеры, многие будут чередовать «1» и «0» или наоборот, если им покажется, что одна из цифр встречается слишком часто.

Теперь рассмотрим приведенную ниже диаграмму по 1000 ставок. Все они были сгенерированы случайным образом. Широкий диапазон возможных исходов позволяет получить некоторое представление о том, насколько легко быть одураченным закономерностями, кажущимися очевидными.
gr-small-numbers-3.jpg
Не забывайте, что эта серия включает 1000, а не 100 ставок. Рассмотрим средний график. Кажется очевидным, что ставки делал профессиональный игрок или типстер: доход составляет 5 %, а устойчивый рост прибыли наблюдается на протяжении всей серии ставок – только лучшие гандикаперы способны демонстрировать такие показатели в течение длительного времени. И все же это результат случайности.

С помощью биномиального распределения мы можем определить вероятность получения прибыли после нескольких раундов ставок, даже если ожидание равно –2,5%.

Количество ставок (коэффициент 1,95, вероятность победы 50 %) Минимальное количество требуемых выигрышей Вероятность получения прибыли
100 52 38.22%
250 129 32.90%
500 257 28.05%
1000 513 21.46%
2500 1283 9.68%
5000 2565 3.40%
10 000 5129 0.51%

Даже несмотря на то что это не более чем случайность, шансы на получение прибыли после серии из 1000 ставок по-прежнему остаются и оцениваются как 1 к 5. Если бы мы делали по одной ставке с форой на каждую игру NFL, это заняло бы почти четыре сезона. Нужно много времени для того, чтобы мы поверили, что только удача помогала нам.

Насколько малыми должны быть малые числа?

Закон малых чисел – это когнитивное искажение, заключающееся в том, что люди склонны полагать, что относительно небольшое число наблюдений точно отражает свойства генеральной совокупности. Кроме того, как показало это упражнение, малое иногда бывает довольно большим. Это явление существует по причине того, что неопределенности, невежеству, ассоциативности, неупорядоченности и случайности люди предпочитают уверенность, обоснованность, причинность, закономерность и навыки (в особенности те, что ориентированы на достижение личных целей). Неспособность реально оценить его значение может дорого стоить игрокам, делающим ставки на спорт.

sportstatist.com

Источник: pinnacle.com