В первой части этой статьи Дэвид Самптер, профессор прикладной математики, объяснил процесс построения модели ставок, основанной на данных о ничьих с заниженными коэффициентами. Теперь он анализирует, можно ли использовать концепцию ожидаемого количества голов для того, чтобы выявлять выгодные букмекерские коэффициенты. Возможно ли это? Прочитайте статью и узнайте ответ на этот вопрос.
Ожидаемое количество голов: обзор
В течение последних нескольких лет наибольшее внимание приковано к модели ожидаемого количества голов в футболе. Концепция ожидаемого количества голов проста и основана на оценке голевых моментов.
Если игрок совершает удар, находясь в зоне ворот, то мы интуитивно понимаем, что у него больше шансов забить гол, чем если бы он пытался сделать это с дистанции 28 м (30 ярдов). Модель ожидаемого количества голов позволяет преобразовывать интуитивные догадки в вероятности. Для каждого голевого момента определяется вероятность его успешности.
Существует много материалов, в которых приведено объяснение концепции ожидаемого количества голов, но есть один ключевой момент, на который необходимо обратить особое внимание: самым важным в этой модели является то, с какой дистанции выполнен удар.
Посмотрите на рисунок ниже, где воздушные шары соотносятся с голами. Эти шары представляют вероятности попадания мяча в ворота на основании степени опасности голевых моментов (см. значение в шаре). Опасность голевых моментов вне пределов диаграммы оценивается в 3 %.
Таким образом, вы можете разработать собственную модель ожидаемого количества голов для команды непосредственно во время просмотра матча. Просто считайте голевые моменты в пределах каждого воздушного шара.
Если вы насчитали два голевых момента внутри воздушного шара с коэффициентом 30 %, один – внутри шара с коэффициентом 15 %, пять – внутри шара с коэффициентом 7 % и десять – вне воздушных шаров, то ожидаемое количество голов команды рассчитывается следующим образом:
2 × 0,30 + 1 × 0,15 + 5 × 0,07 + 10 × 0,03 = 0,855 x G
Моя модель ожидаемого количества голов немного сложнее, чем представленная выше. Я принимаю во внимание тип удара (ответный удар, удар головой, удар с близкого расстояния или позиции «один на один»), а также ряд других факторов. Это позволяет повысить эффективность модели, поскольку в этом случае учитываются данные не только о позиции выполнения удара. Однако информация о дистанции ударов – это как раз то, с чего нужно начинать работу при создании модели ожидаемого количества голов.
Ожидаемое количество голов: выявление выгодных коэффициентов
Вопрос, который возникает в отношении любой модели ставок, заключается в том, насколько она эффективна при поиске выгодных коэффициентов. Как было сказано в первой части статьи, я скептически отношусь к идее существования магической формулы размещения ставок. Может ли модель ожидаемого количества голов помочь в решении этой проблемы? Можно ли с ее помощью выявлять выгодные коэффициенты?
Для того чтобы ответить на этот вопрос, сначала нужно изучить коэффициенты по ставкам на футбол. Когда я ставлю перед собой цель найти неточности коэффициентов по ставкам на футбол, я использую статистическую модель, которая называется логистической регрессией.
Суть регрессии заключается в определении того, насколько точно коэффициенты по ставкам на футбол отражают вероятность определенного исхода матча. Представьте, что мы должны вычислить вероятность выездной победы.
Нам необходимо откорректировать модель для расчета вероятности выигрыша команды в гостевом матче: в этом случае a – это коэффициент букмекера на победу в выездной игре (указан в десятичном формате и без учета букмекерской маржи), который является неизменным. Если понятие логистической регрессии вам незнакомо, существует множество онлайн-руководств, в которых приведены объяснения.
Логистическая регрессия: пример
Ниже приведен пример использования логистической регрессии для анализа данных последних двух сезонов Premier League (2015–2016 и 2016–2017 гг.).
Размер точек здесь пропорционален количеству раз, когда букмекеры предлагали делать ставки с указанными коэффициентами. Чем больше точки, тем чаще предоставлялись эти коэффициенты.
Главным является не результат применения модели, а сама методика ее использования. Если вы хотите построить модель и выигрывать деньги, делая ставки на футбол, всегда начинайте с анализа коэффициентов.
Если эти окружности находятся ниже пунктирной линии, то вероятность выездной победы меньше, чем на то указывает коэффициент. Если окружности находятся выше пунктирной линии, то вероятность выездной победы выше, чем на то указывает коэффициент.
Сплошная линия показывает наиболее точное соответствие данным. Эта линия позволяет сделать вывод об общей тенденции. Если вы внимательно посмотрите на кривую прогнозируемых вероятностей со значением около 0,1, что приблизительно соответствует коэффициенту 10,0, вы увидите, что она расположена чуть выше линии, в то время как для прогнозируемых вероятностей со значением выше 0,25 наблюдается обратная тенденция.
Это свидетельствует о том, что в последних двух сезонах аутсайдеры выигрывали, а фавориты проигрывали выездные матчи чаще, чем можно было ожидать, ориентируясь на букмекерские коэффициенты.
Недооцененные аутсайдеры и переоцененные фавориты
Поиск выгодных вариантов ставок на матчи последних двух сезонов предполагает выявление аутсайдеров и фаворитов, которые, соответственно, выигрывали и проигрывали выездные матчи. Для этого можно использовать концепцию ожидаемого количества голов. Мной была разработана новая модель логистической регрессии с помощью указанной ниже формулы.
Я добавил переменную xGDiff. Эта переменная – разница в ожидаемом количестве голов двух команд, рассчитанная на основании их соответствующих средних показателей за последние 5 матчей.
При использовании этой логистической регрессии я обнаружил, что вероятность победы команд, которые участвуют в выездных матчах и имеют лучшие показатели разницы (xGDiff), выше, чем на то указывают коэффициенты.
Таким образом, если нам удается выявить участвующего в выездном матче аутсайдера с высоким показателем ожидаемого количества голов (xG), то есть смысл сделать ставку на эту команду. Ставок на фаворитов с низким показателем xG следует избегать.
Логистическая регрессия: иллюзия ожидаемого количества голов
Ниже представлена таблица с данными ожидаемого количества голов в текущем сезоне (2017–2018 гг.) по состоянию на 11 неделю.
Испытать модель можно на примере матча WBA против Chelsea. Показатель xGDiff для этих команд рассчитывается следующим образом:
(8.3+11.9 — 12.7-11.9)/2 = -2.7
В одном матче он равен –0,25. На момент написания этой статьи фаворитом была команда Chelsea с коэффициентом a = 1,62*. Подставив этот коэффициент и xGDiff в уравнение (2), получаем следующее: P (выездная победа) = 42 % (параметры b0 = –0,49, b = 0,75 и b2 = 0,73 откорректированы на основании данных предыдущих сезонов).
Таким образом, хотя коэффициент указывает, что вероятность победы Chelsea составляет 62 %, результаты применения модели свидетельствуют о том, что шансы команды намного ниже. Лучше всего ставить на то, что Chelsea не выиграет.
Модель ожидаемого количества голов позволяет преобразовывать интуитивные догадки в вероятности. Для каждого голевого момента определяется вероятность его успешности.
Еще одной игрой, которая выделяется на фоне других, представленных в таблице выше, является выездной матч Southampton, где принимающей стороной была команда Liverpool. Показатель xGDiff равен 0,36 в пользу ливерпульцев, а это означает, что они являются фаворитами. Но коэффициент на победу Southampton составляет 8,3, что предполагает вероятность выигрыша в 12 %.
Расчеты по моей модели указывают на то, что вероятность победы саутгемптонцев равна 15 %. Это означает, что есть смысл поставить на победу Southampton, хотя стоит помнить о том, что даже если расчеты верны, команда может выиграть только в 15 % случаев.
Уроки, извлеченные из опыта применения модели
Главным является не результат применения модели (обе команды – WBA и Southampton – проиграли), а сама методика ее использования. Если вы хотите построить модель и выигрывать деньги, делая ставки на футбол, всегда начинайте с анализа коэффициентов.
Во-первых, используйте логистическую регрессию для поиска несоответствий коэффициентов, а затем добавляйте переменные (например, ожидаемое количество голов) для того, чтобы оценить перспективы получения преимущества. Это преимущество будет небольшим, но оно вполне может окупиться в долгосрочной перспективе.
СМОТРИТЕ ТАКЖЕ: ТОП 100 БУКМЕКЕРСКИХ КОНТОР >>>
СМОТРИТЕ ТАКЖЕ: ТОП 20 КРИПТОВАЛЮТНЫХ БУКМЕКЕРОВ >>>
СМОТРИТЕ ТАКЖЕ: БУКМЕКЕРЫ ДЛЯ КИБЕРСПОРТА >>>
Источник: pinnacle.com