Десять уравнений, которые правят миром. И как их можете использовать вы - стр. 11
Единственный способ обыграть букмекеров – рассмотреть эти числа, и именно такие данные компьютер Яна собирал после того, как мы посидели в пабе. Он скачал коэффициенты и результаты для всех матчей чемпионатов мира и Европы, включая отборочные игры, начиная с чемпионата мира в Германии в 2006 году. Утром, усевшись в моем офисе в университете, мы начали искать преимущество.
Сначала мы загрузили данные и посмотрели на них в таблице, подобной нижеприведенной.
Из таких прошлых результатов мы можем получить представление о том, насколько точны коэффициенты: для этого надо сравнить два последних столбца вышеприведенной таблицы. Например, в матче между Испанией и Австралией на чемпионате мира 2014 года коэффициенты дают вероятность 73 %, что Испания выиграет, и она действительно победила. Это можно считать «хорошим» прогнозом. А вот Коста-Рика обыграла Италию, хотя коэффициенты давали 63 % на победу итальянцев, – «плохой» прогноз.
Я пишу слова «хороший» и «плохой» в кавычках, поскольку нельзя сказать, хорош или плох прогноз, если нет альтернативы, с которой его можно сравнить. Вот здесь и появляются α и β. Их называют параметрами уравнения 1. Это величины, которые мы можем менять для тонкой настройки нашего уравнения, чтобы сделать его точнее. Мы не можем изменить итоговые коэффициенты для матча Испания – Австралия и определенно неспособны повлиять на результат этого матча сборных; но можем выбрать α и β так, чтобы получить более точный прогноз, чем у букмекеров.
Метод поиска наилучших параметров – логистическая регрессия. Чтобы описать, как она работает, сначала посмотрим, как можно улучшить наш прогноз на матч Испания – Австралия с помощью корректировки числа β. Если я приму β = 1,2 и оставлю α = 1, получу
Поскольку результатом матча была победа Испании, прогноз на победу в 77 % лучше, чем прогноз букмекеров, который давал 73 %.
Но здесь есть проблема. Если я увеличу β, то повышу и прогнозируемую вероятность победы Англии над Уругваем – с 51 до 52 %. Но Англия в том матче 2014 года уругвайцам проиграла. Чтобы справиться с этой проблемой, я могу увеличить другой параметр, назначив α = 1,1 и оставив при этом β = 1,2. Теперь уравнение предсказывает, что Испания обыграет Австралию с вероятностью 75 %, а Англия обыграет Уругвай с вероятностью 49 %. Изменив исходные значения α = 1 и β = 1, мы улучшили прогноз на оба матча.
Я рассмотрел по одному изменению каждого из параметров α и β и сравнил результаты всего по двум матчам. Данные Яна включали 284 матча на всех чемпионатах мира и Европы с 2006 года. Потребовалось бы очень много времени, чтобы вручную менять значения параметров, подставлять их в уравнение и смотреть, улучшают они прогноз или нет. Однако мы можем использовать для вычислений компьютерный алгоритм; именно это и делает логистическая регрессия (см. рис. 1). Она меняет значения α и β так, чтобы дать прогнозы, которые максимально близки к реальным результатам матчей.