Прогноз Евро-2016: система Microsoft предсказывает победу Германии - Технологии
$56.39
63.12
ММВБ1960.16
BRENT54.24
RTS1096.83
GOLD1252.48

Прогноз Евро-2016: система Microsoft предсказывает победу Германии

читайте также
+34 просмотров за суткиМолодая гвардия: как Дмитрий Рыболовлев сделал «Монако» чемпионом Франции впервые за 17 лет +30 просмотров за суткиФутбол как инвестиция: насколько успех команды зависит от вложенных средств? +17 просмотров за сутки«Любовь не продается»: Леонид Федун о стоимости «Спартака» +11 просмотров за суткиМир на квантах: чего не хватает в России для развития инфраструктуры нового рынка +4 просмотров за суткиБудущее рынка общепита: как стартапы заново изобретают ресторан +34 просмотров за сутки«Гализей» для боя «быков». Как выглядит стадион Сергея Галицкого +2 просмотров за суткиКапитальный ремонт: зачем «Реал» и «Барселона» перестраивают свои стадионы +5 просмотров за суткиVR как неторопливая инновация. Достоинства и недостатки решений виртуальной реальности Будущее онлайн-образования в России: рост и осторожные инвестиции +15 просмотров за суткиИдет репетиция: что такое футбольный Кубок конфедераций +10 просмотров за суткиВиртуальный диван: как российские инженеры учат риелторов в США использовать 3D-туры для продаж +5 просмотров за суткиMicrosoft, eBay и Tencent вложились в индийского конкурента Amazon и Alibaba +17 просмотров за сутки«Хотим открыть на «Казань Арене» Hard Rock Cafe» +10 просмотров за сутки«Многие начинают возвращаться»: российский венчурный рынок восстанавливается +3 просмотров за суткиMorgan Stanley по ошибке завысил прогнозируемую прибыль Snap на $5 млрд +2 просмотров за суткиAndroid впервые обошла Windows по популярности среди интернет-пользователей +3 просмотров за суткиОслабить пояса: в чем опасность стратегии тотальной экономии для стартапов +6 просмотров за сутки«Умные» холодильники, дома и автомобили. На чем можно заработать? +41 просмотров за суткиТочка притяжения: Сергей Галицкий и краснодарский «Гализей» +13 просмотров за сутки2017-й год для виртуальной и дополненной реальности: как технологии придут на массовый рынок +5 просмотров за суткиMicrosoft запустила сервис Teams
Технологии #Microsoft 10.06.2016 15:25

Прогноз Евро-2016: система Microsoft предсказывает победу Германии

«Осьминог-оракул» Пауль, получивший известность благодаря предполагаемой способности угадывать исходы матчей с участием футбольной сборной Германии Фото REUTERS / Ina Fassbender
Мониторинг высказываний в соцсетях добавляет 5% к точности прогноза

Система от Microsoft под названием Cortana Intelligence Suite прогнозирует, что в чемпионате Европы по футболу с вероятностью 66% победит Германия. Как утверждает искусственный интеллект, в матче с Англией 11 июня Россия не забьет ни одного гола, проведет менее четырех атак, а число результативных пасов не превысит 221.

Для прогнозирования результатов Cortana Intelligence Suite использует комплексный анализ двух факторов: статистические данные (соотношение побед и поражений команды, количество забитых голов, место проведения матча, погодные условия) и данные веб-поиска и социальных сетей (феномен «коллективного разума»). Шанс выигрыша каждой команды определяется в процентном соотношении, рассчитывается вероятность ничьей в матчах для каждой игры отборочного тура.

Систему впервые опробовали на предсказании результатов матчей Чемпионата мира по футболу в 2014 году. Тогда правильными оказались 15 из 16 прогнозов исходов игр. После этого Microsoft составляла прогнозы для чемпионата мира по футболу среди женщин, английской Премьер-лиги, Лиги чемпионов УЕФА, чемпионата Бразилии, чемпионата Франции, чемпионата Испании, чемпионата Германии, чемпионата Италии.

Алгоритмы анализируют результаты матчей всех этих соревнований и выявляют, что именно приводит команды к успеху. Достижения одной команды разных лет относятся не только к успехам той же самой команды. Например, «игра на своем поле» в 2000 году, которая помогла команде Нидерландов продвинуться в зачете, влияет и на результаты сборной Франции в 2016 году. Предиктивные алгоритмы, анализируя большой массив данных, понимают, что одни команды лучше играют в определенных погодных условиях, а другие побеждают, когда противостоят тому или иному стилю игры противника.

Результаты анализа статистики дополняет анализ мнений «коллективного разума». Как оказалось, качество прогноза любителей спорта зависит от доступной им достоверной информации. Но даже имея достаточно много сведений, люди не всегда делают правильный прогноз.

Самые неожиданные факторы могут повлиять на исход матча, но люди и не думают о них.

Например, в 2016 году по итогам чемпионата Национальной футбольной лиги США по американскому футболу было много критики в адрес команды Новой Англии, за то что она не попросила тайм-аут за одну минуту до конца игры. Это не пришло в голову тренеру. Люди, конечно, тоже не могли предвидеть, что именно тайм-аут решит судьбу матча.

К тому же эксперты Microsoft обнаружили, что анализ поисковых запросов любителей спорта и их публикаций в соцсетях позволяет лучше узнать мнения людей, чем соцопросы. Оказывается, отвечая социологам, люди находятся под влиянием предубеждений, а в их интернет-активности этого нет.

В целом феномен «коллективного знания» недооценен, считают в Microsoft. Результаты мероприятий, на которые, казалось бы общественное мнение повлиять не может (футбольные чемпионаты как раз этот случай), на самом деле можно предсказать, анализируя поведение людей в интернете. Так Cortana Intelligence Suite прогнозирует результаты ТВ-шоу, выборов, церемоний награждения и самых разных конкурсов, основанных на голосовании. Cortana Intelligence Suite выявляет, какие именно публичные действия пользователей коррелируют с распределением голосов. На этих корреляциях и составляются предиктивные алгоритмы.

Именно так Microsoft в частности предсказывает результаты «Оскара». В 2015 году Cortana Intelligence Suite удалось правильно предсказать 20 из 24 лауреатов «Оскара» и победу Леонардо Ди Каприо.

С 2015 года эта же система делала предсказания по победителям для самых популярных еженедельных шоу в США American Idol, The Voice и Dancing with the Stars, и точность была более 85%, говорят в Microsoft. 

Мероприятия, механизмы прогнозирования которых несколько различаются, делятся на три категории: конкурсы со зрительским голосованием, конкурсы с жюри и соревнования. Легче всего предсказать результаты для первой категории — достаточно анализа информации из открытых источников и социальных сетей, чтобы определить мнение большинства. Для второй категории нужен более сложный анализ, сочетающий мнение масс и объективные факторы, влияющие на выбор жюри. Третья категория, к которой относятся спортивные игры, является самой сложной для предсказаний, так как на нее влияет огромное количество не связанных друг с другом факторов. Но здесь срабатывает такой феномен, как «мудрость толпы».

Доказано, что в случаях, когда отдельно взятые эксперты могут ошибаться, анализ общественного мнения добавляет 5% к точности прогноза.

«Идея проста: никто не может знать все, но совокупные знания большого количества отдельных людей формируют глобальное мнение, обладающее предикативными свойствами благодаря содержанию самой последней релевантной информации», — говорит Дмитрий Марченко, директор по маркетингу технологий обработки данных и облачной платформы Microsoft в России. Такой подход очень результативен в случае форс-мажоров. Если, например, игрок получает травму или красную карточку. Эти непредсказуемые события создают необходимость корректировать прогноз «в реальном времени». Сделать это можно, только анализируя отклик людей на произошедшее — мониторинг высказываний в онлайн-среде позволяет это.

Алгоритмы машинного обучения уже продемонстрировали способность извлекать скрытые закономерности в данных, недоступные нашему взгляду, отмечает Дмитрий Коробченко, глава проектов в исследовательском центре Samsung. Анализ высказываний пользователей в интернете как раз может помочь найти такие неявные взаимосвязи. «Действительно может оказаться, что алгоритмы машинного обучения нашли скрытые корреляции между не связанными на первый взгляд событиями (общественное мнение и результаты спортивных состязаний), — говорит Коробченко. — С другой стороны, таких признаков (факторов) может быть очень много. Одни из них будут релевантными и потому прибавят точности предсказанию, другие — «шумом» и будут портить результат». Поэтому выбирают подмножество, объясняет Коробченко, причем выбор связан с доступностью данных. Например, легко собирать данные по запросам в поисковиках и социальным сетям,  а вот получить данные о кардиограмме каждого футболиста на поле  — сложно, хотя  это, возможно, могло бы быть более релевантным фактором. Получается, принцип «больше данных — лучше» не всегда оправдан. 

Прогнозы с использованием машинного обучения становятся все интереснее и бизнесу, и обычным людям, отмечает Михаил Левин, руководитель службы анализа больших данных «Яндекса». Технологии машинного обучения помогают корпорации прогнозировать, например, погоду, или спрос на товары с учетом промоакций. Для «Росавтодора» Yandex Data Factory предсказывала самые аварийно опасные участки дорог, а для Wargaming  — отток пользователей из игры World of Tanks. «Предиктивные алгоритмы —  горячая тема в техническом образовании, — отмечает Левин. — Например, совместно с ВШЭ мы запустили курс по машинному обучению на Coursera. В финальном проекте студентам нужно предсказывать результаты игр в Dota. В общем, любой студент может записаться на бесплатный курс и, закончив его, делать свои прогнозы  о результатах матчей».

«Каждый, кто начинает более-менее глубоко заниматься машинным обучением, задумывается, не спрогнозировать ли котировки на бирже или исходы тех или иных соревнований или игр, — соглашается Виктор Канторстарший преподаватель кафедры «Алгоритмы и технологии программирования» факультета инноваций и высоких технологий МФТИ и руководитель исследовательской группы в Yandex Data Factory. — Можно оставить алгоритм делать ставки, а тебе останется радоваться постоянному доходу, путешествовать и наслаждаться жизнью. Людей обычно останавливают два фактора — пока еще ненулевой порог входа на этот рынок и этические мотивы. Чаще, пожалуй, важнее первое, но признаваться в этом как-то неловко —  ссылаются на второе».