На фоне давешних успехов гуглоробота по игре в го страшноватенько смотрится сегодняшнее объявление Microsoft о том, что их облачный сервис продвинутой аналитики и машинного обучения Cortana Intelligence Suite готов уже сейчас предсказать результаты Чемпионата Европы по футболу. Прогнозируют, что 10 июля на Stade de France встретятся в финале сборные Германии и Испании, причём немцы победят, в строгом соответствии с известной формулой Линекера.

Понятно, что пока что система говорит о 66%-ной достоверности своего прогноза, и это лишь обещания, которые нам предстоит за ближайший месяц проверить на практике. Может, там совершенно другие команды в финал пройдут. Все букмекеры, например, в один голос, хоть и с разным коэффициентом выплаты, прогнозируют победу французов, а у них, между прочим, тоже прогноз основан на математических моделях и алгоритмическом вычислении... Навскидку можно тут предположить, что букмекеры, отдавая предпочтение французам, учитывают тот факт, что этот чемпионат для них будет домашним (а когда чемпионат Европы последний раз проводился во Франции, то как раз хозяева его и выиграли, всухую разгромив Испанию на Parc des Princes в июне 1984). С другой стороны, система облачных вычислений может учитывать тот факт, что за последующие 28 лет и 7 турниров хозяева ЧЕ не побеждали в нём ни разу, и даже в финал пробились лишь однажды (Португалия в 2004-м)... Не в том дело.
А дело в том, что big data — штука устрашающе эффективная. Именно потому, что она безо всяких предрассудков может проанализировать абсолютно любые статистические взаимосвязи, до существования которых разум исследователя не в состоянии сам додуматься. Наши сомнения в прогностическом всемогуществе big data основаны всего лишь на вере во всесилие слепого Случая, способного сломать всю стройную логику объективных причинно-следственных связей: оттого, что в кузнице не было гвоздя...
Но ведь во всей череде описанных Маршаком неприятностей случайна лишь одна — отсутствие гвоздя в кузнице. Все последующие провалы закономерны и подчиняются стройной логике взаимосвязанных событий. То есть их вполне можно было бы спрогнозировать, если б некая компьютерная система имела о них информацию в реальном времени! А, возможно, и отсутствие гвоздя, хоть оно и не объяснено Маршаком, тоже имело под собой какую-то логистическую причину: например, в осаждённом городе истощились запасы металла, наступил упадок кузнечной отрасли, наметились проблемы с переоснащением кавалерии. В таком случае и гвоздь, и подкову, и гибель командира, и гибель конницы, и крах всей зависящей от неё обороны, тоже можно было бы спрогнозировать заранее, если б в те времена собиралась и анализировалась big data...
Поэтому я вполне могу допустить, что существует в природе такое количество разных случайных и разрозненных данных, одновременный учёт которых позволит довести точность футбольного прогноза и до 80%, и до 95%. Конечно, и у болельщиков, и у букмекеров останется надежда на чудо. Но, боюсь, в ситуации, когда исход 19 из 20 матчей будет с абсолютной точностью предсказываться роботом, такое развитие искусственного интеллекта может иметь для будущего футбола (и некоторых сопутствующих ему индустрий) не менее серьёзные последствия, чем для шахмат, шашек и го...

Понятно, что пока что система говорит о 66%-ной достоверности своего прогноза, и это лишь обещания, которые нам предстоит за ближайший месяц проверить на практике. Может, там совершенно другие команды в финал пройдут. Все букмекеры, например, в один голос, хоть и с разным коэффициентом выплаты, прогнозируют победу французов, а у них, между прочим, тоже прогноз основан на математических моделях и алгоритмическом вычислении... Навскидку можно тут предположить, что букмекеры, отдавая предпочтение французам, учитывают тот факт, что этот чемпионат для них будет домашним (а когда чемпионат Европы последний раз проводился во Франции, то как раз хозяева его и выиграли, всухую разгромив Испанию на Parc des Princes в июне 1984). С другой стороны, система облачных вычислений может учитывать тот факт, что за последующие 28 лет и 7 турниров хозяева ЧЕ не побеждали в нём ни разу, и даже в финал пробились лишь однажды (Португалия в 2004-м)... Не в том дело.
А дело в том, что big data — штука устрашающе эффективная. Именно потому, что она безо всяких предрассудков может проанализировать абсолютно любые статистические взаимосвязи, до существования которых разум исследователя не в состоянии сам додуматься. Наши сомнения в прогностическом всемогуществе big data основаны всего лишь на вере во всесилие слепого Случая, способного сломать всю стройную логику объективных причинно-следственных связей: оттого, что в кузнице не было гвоздя...
Но ведь во всей череде описанных Маршаком неприятностей случайна лишь одна — отсутствие гвоздя в кузнице. Все последующие провалы закономерны и подчиняются стройной логике взаимосвязанных событий. То есть их вполне можно было бы спрогнозировать, если б некая компьютерная система имела о них информацию в реальном времени! А, возможно, и отсутствие гвоздя, хоть оно и не объяснено Маршаком, тоже имело под собой какую-то логистическую причину: например, в осаждённом городе истощились запасы металла, наступил упадок кузнечной отрасли, наметились проблемы с переоснащением кавалерии. В таком случае и гвоздь, и подкову, и гибель командира, и гибель конницы, и крах всей зависящей от неё обороны, тоже можно было бы спрогнозировать заранее, если б в те времена собиралась и анализировалась big data...
Поэтому я вполне могу допустить, что существует в природе такое количество разных случайных и разрозненных данных, одновременный учёт которых позволит довести точность футбольного прогноза и до 80%, и до 95%. Конечно, и у болельщиков, и у букмекеров останется надежда на чудо. Но, боюсь, в ситуации, когда исход 19 из 20 матчей будет с абсолютной точностью предсказываться роботом, такое развитие искусственного интеллекта может иметь для будущего футбола (и некоторых сопутствующих ему индустрий) не менее серьёзные последствия, чем для шахмат, шашек и го...
no subject
Date: 2016-06-08 05:29 pm (UTC)no subject
Date: 2016-06-08 05:34 pm (UTC)no subject
Date: 2016-06-08 05:43 pm (UTC)no subject
Date: 2016-06-08 05:44 pm (UTC)Например, вот 66%: - как в принципе можно это проверить?
no subject
Date: 2016-06-08 05:46 pm (UTC)А потом хоть потоп. Придумаем что-нибудь еще.
no subject
Date: 2016-06-08 05:52 pm (UTC)no subject
Date: 2016-06-08 06:05 pm (UTC)А чего тогда метеорологи какие-то погодные модели и их взаимодействие считают на суперконтуперах и то не всегда результат соответствует действительности, когда, как вы утверждаете, биг-дата такая крутая? :)
no subject
Date: 2016-06-08 06:07 pm (UTC)и медленно катали мяч. Я спросил у Искрины, какой счет, она сказала,
что счет будет открыт только на двадцать четвертой минуте, а вся игра
закончится со счетом 5:4 в пользу "Спартака".
- Откуда ты знаешь? - спросил я.
- Так написано в программе.
- Разве счет устанавливается кем-то заранее? - спросил я.
- Конечно, - сказала Искрина. - Спортивный Пятиугольник все
планирует задолго до матча. А в твое время разве было не так?
- Совсем не так, - сказал я. И объяснил, что в мое время
спортсмены были моложе и счет складывался стихийно в процессе игры.
- Я не понимаю, что значит стихийно, - сказала она. - Кто-то же
всё-таки этот счет устанавливал.
- Да никто не устанавливал! Просто игроки бегали по полю, пинали
мяч, били по воротам, и кто больше заколотит, у того больше и счет.
- Но это же волюнтаризм, - сказала она возмущенно. - Это, выходит,
кто быстрей бегает или сильнее бьет, тот больше и забивает?
- Ну да, - сказал я, - именно так. Правда, в годы расцвета
коррупции бывало так, что одна команда давала взятки другой и тогда
счет определялся иначе.
- Вот видишь, - сказала Искрина. - Значит, была почва для
злоупотреблений. А сейчас такого не может быть. Сейчас Спортивный
Пятиугольник устанавливает счет в зависимости от положения той или
иной команды, от того, насколько игроки дисциплинированны, как изучают
произведения Гениалиссимуса и к какой категории потребностей они
относятся. Не может же быть так, чтобы команда общих потребностей
безнаказанно забивала мячи команде повышенных потребностей!
no subject
Date: 2016-06-08 06:16 pm (UTC)no subject
Date: 2016-06-08 06:18 pm (UTC)no subject
Date: 2016-06-08 06:22 pm (UTC)Такое впечатление, что это бигдата - такая же пиар-пурга, как и гиперлуп и рейлган
no subject
Date: 2016-06-08 06:24 pm (UTC)P.S. И "вопрос на засыпку", в тему того, сколько раз в ЧЕ побеждали его хозяева: если кидать монетку (не жульничая) 28 раз подряд, и всё время выпадал орёл, то какова вероятность, что в следующий раз будет решка?
no subject
Date: 2016-06-08 06:30 pm (UTC)И 120 лет назад к нему были в точности такие же претензии.
Большой вопрос — вуду это или легитимный метод познания.
Если вуду, тогда Ваш аргумент легитимен.
А если легитимная методика, которая сегодня несовершенна — значит, её будут допиливать и допилят.
no subject
Date: 2016-06-08 06:31 pm (UTC)no subject
Date: 2016-06-08 06:35 pm (UTC)Конечно, я не знаю всех деталей нашего внутреннего софта для букмекеров. Но те расчёты вероятностей, о которых я знаю, связанны именно с потоком ставок, а не со статистикой прошлых игр.
no subject
Date: 2016-06-08 06:36 pm (UTC)no subject
Date: 2016-06-08 06:38 pm (UTC)no subject
Date: 2016-06-08 06:44 pm (UTC)Любое предсказание это в той или иной степени вуду.
Особенно, когда маркетологи начинают рекламировать результаты методов вуду как строго научные, с целью дальнейшей продажи.
ps: Некий покойный осьминог в своих футбольных предсказаниях вполне обходился без биг-дата, вуду и компании microsoft. :)
no subject
Date: 2016-06-08 06:49 pm (UTC)Большинство причин, оказывающих влияние на матч, происходят здесь и сейчас, за сутки до матча, во время матча. Психологические спады, травмы, не выспался, отравился, тренер не так посмотрел -- как это предсказать? Исторические аналогии, статистика предыдущих встреч команд, суммарная трансферная стоимость команды -- это всё не особо влияет на исход в случае приблизительно равных команд. Тут нет BigData в принципе, нечего анализировать. Есть результат взаимодействия 30 человек с каждой стороны, плюс судьи. Спрогнозировать отсутствие гвоздя легче, есть что анализировать.
Знаете, какая команда делегировала больше всего игроков на предстоящий Евро? Ни одна мат. модель не могла заранее предсказать, что это будет команда, которая не играла в этом году в ЛЧ и в чемпионате своей страны заняла всего лишь 8-е место.
Тут скорее психология групп, выигрывает тот, кто лучше всего построил коллектив, как бы социалистически это не звучало. Если только внедрить камеры в тренировочный лагерь и каким-то образом измерять психологию победителей по лицам игроков перед матчем.
Но на дистанции кругового чемпионата сенсаций всегда меньше, побеждает выстроенная система.
P.S. BigData уже привели к прорыву в NBA в области теории и практики коллективной защиты. В какой-то момент этим воспользовались 2-3 умных тренера, получили преимущество. Теперь полученными мат.моделями пользуются все, никакого преимущества, все продолжают копать, выискивая те или иные закономерности. Впрочем, чтобы предсказывать NBA в этом сезоне -- много думать не надо.
no subject
Date: 2016-06-08 07:18 pm (UTC)no subject
Date: 2016-06-08 07:27 pm (UTC)no subject
Date: 2016-06-08 07:42 pm (UTC)В идеальном варианте, зарабатывают более-менее одинаковые деньги, при любом исходе.
no subject
Date: 2016-06-08 07:55 pm (UTC)no subject
Date: 2016-06-08 08:19 pm (UTC)no subject
Date: 2016-06-08 08:28 pm (UTC)no subject
Date: 2016-06-08 08:53 pm (UTC)Возможность определения всех факторов, влияющих на результат идет вразрез как минимум с авраамическими религиями, т.к. является ничем иным как постижением "Путей Господних".
no subject
Date: 2016-06-08 09:14 pm (UTC)расшифровать?
no subject
Date: 2016-06-08 09:18 pm (UTC)Простите, но лучше занимайтесь фронтендом.
no subject
Date: 2016-06-09 05:04 am (UTC)скорее это событие актуальнее вспомнить чем победу в 1984
no subject
Date: 2016-06-09 05:55 am (UTC)no subject
Date: 2016-06-09 07:29 am (UTC)no subject
Date: 2016-06-09 09:30 am (UTC)no subject
Date: 2016-06-09 10:47 am (UTC)no subject
Date: 2016-06-09 11:30 am (UTC)Монета не "запоминает" результаты предыдущих бросков, и вероятность выпадения решки при каждом конкретном броске действительно 50%.
no subject
Date: 2016-06-09 04:47 pm (UTC)Спасибо, Капитан! Надеюсь, вы планируете опубликовать этот замечательный результат в Nature? Нечестно будет скрывать такую новость от человечества. Опять же, Нобелевскую премию за это дадут непременно.
no subject
Date: 2016-06-09 06:52 pm (UTC)no subject
Date: 2016-06-10 01:36 pm (UTC)no subject
Date: 2016-06-10 08:45 pm (UTC)no subject
Date: 2016-06-10 10:31 pm (UTC)no subject
Date: 2016-06-12 11:07 am (UTC)Этого бояться бессмысленно так как это невозможно - CIS выдает не конкретный результат матча, а вероятности результатов.
Например, на сегодняшний матч Германия - Украина анализ CIS выдает такой расклад:
Германия 0.632816408 Украина 0.114273932 - указана вероятность победы.
Даже если это абсолютно на 100% соответствует действительности, то каким образом это снижает интерес к игре? Ведь будет сыгран один-единственный уникальный матч, а не миллиард (который был бы необходим, чтобы получить цифры указанные выше).
Вчера Англия должна была побеждать с вероятностью 63,5 % на ничью оставалось всего 15% - и тем не менее случилась именно ничья.
Что реально интересно в таком прогнозировании - это сравнить уровень CIS и букмекерских контор, кто лучше.
Чем я и занимаюсь - выписываю прогнозы от CIS и БК, потом подвожу итог - записи веду у себя в ЖЖ.
no subject
Date: 2016-06-13 02:03 pm (UTC)