Сила чисел

Квентин Харди Forbes Contributor
Создатель самой знаменитой статистической программы хочет дать возможность каждому человеку самому стать аналитиком

Каждые две недели человечество накапливает больше информации, чем за всю свою историю до 2000 года. Эти космические объемы данных сулят свободу, эффективность и влияние каждому, кто сможет их обрабатывать. Именно этим и занимается всю жизнь профессор Норман Най.

В 1968 году Най, только получивший степень по политическим наукам, стал одним из изобретателей самой знаменитой статистической программы — Statistical Package for Social Sciences. SPSS, наряду с разработками других пионеров вроде института SAS, породила аналитическую и предсказательную статистику — и научила корпорации производить, оценивать и продавать свою продукцию. Теперь, в 67 лет, Най хочет снабдить статистическим инструментарием каждого обывателя. Если текстовые редакторы превратили нас всех в издателей, а Youtube —в кинопродюсеров, то статистика может из каждого сделать аналитика.

«Мы находимся в начале пути, который изменит облик национальных государств, — рассуждает Най. — Люди смогут принципиально иначе оценить последствия того или иного действия или политического решения. Это может привести либо к усилению отдельной личности, либо к развитию технологий манипуляции и контроля. В любом случае мир станет другим».

Статистика — довольно молодая наука. Она была создана в XVII веке для оценки рисков в азартных играх и расцвела в начале XX в результате стремительного прогресса измерительных приборов. Человеческий мозг, выводящий закономерности из многочисленных наблюдений, — тоже своего рода статистический инструмент. Он принимает решение, ужинать ли ему в определенном ресторане, основываясь на множестве факторов: популярность заведения, наличие метрдотеля, пристрастие к определенной кухне. То же, к чему мозг приходит с помощью догадок, компьютер выводит, изучая единицы информации, порой — триллионы единиц.

Программа SPSS начиналась как академический проект, но со временем стала серьезным бизнесом — прошлым летом, через два года после ухода Ная, IBM купила ее за $1,2 млрд. Она представляет собой набор алгоритмов, позволяющих эксперту быстро выявлять закономерности и делать на их основании предсказания. Например, как цена влияет на продажи цветов в День матери или как меняется потребность в тюрьмах в зависимости от демографической ситуации.

Сложите громкий коммерческий успех SPSS с открытым программным кодом, и вы получите новую компанию, Revolution Analytics. В фирме, основанной Наем в 2007 году, сейчас работает 30 человек.

Revolution основывает свои разработки на бесплатном статистическом языке программирования R, изобретенном новозеландскими учеными и доработанном энтузиастами по всему миру. Открытые библиотеки языка R насчитывают 2500 алгоритмов, написанных пользователями.

Используя R, правозащитная организация Benetech установила закономерности геноцида в Гватемале, а бейсбольный фанат из Западной Вирджинии смог предсказать, когда начнут уставать питчеры, — и получил работу в клубе Tampa Bay Rays. Пропагандист языка Майкл Дрискол доказал с его помощью, что вы в семь раз вероятнее смените мобильного оператора, если в течение последнего месяца это сделал кто-то из ваших друзей. Теперь он использует R для оценивания и размещения интернет-рекламы, анализируя 100 000 переменных в секунду.

R — мощное средство, но очень трудное в освоении. Компания Ная намерена снабдить его хорошо организованными библиотеками, способностью решать более масштабные задачи и пользовательским интерфейсом, позволяющим перетаскивать данные мышкой и получать легко читаемые графики. Продуктовая линейка состоит из бесплатной урезанной версии для университетов и полной бизнес-версии, которая, по словам Ная, будет на 80% дешевле продукции конкурентов из SPSS и SAS. Клиентами Revolution уже стали Pfizer, онкоцентр Йельского университета, Bank of America и Motorola.

Помимо предпринимательских соображений Ная не оставляет идея изменить мир. Разбогатев на SPSS, он не бросил академической карьеры и продолжает работать в Стэнфорде и Университете Чикаго. Когда-то в книге «Меняющийся американский избиратель» он статистическими методами показал, что голосующее население становится все искушеннее и толерантнее. Позже в «Образовании и гражданственности в Америке» Най продемонстрировал, что образованные слои населения терпимее прочих относятся к различиям, но не стремятся расширять свое участие в политической жизни страны.

По мнению ученого, его изобретение могло сыграть роль в расколе политических партий, существующем в сегодняшней Америке. Сегодня, говорит он, дешевые издательские технологии и лучший статистический анализ привели к более острым политическим противоречиям.

«Благодаря опросам вы могли выяснить, чего на самом деле хотят люди, — объясняет Най, — но благодаря этому общество, кажется, разрывается на части». Теперь политики ищут себе группы поддержки с помощью опросов общественного мнения и статистических методов, а избиратели в свою очередь могут голосовать за кандидатов столь же радикальных, сколь они сами. В результате, говорит Най, возникают большие проблемы.

Тем не менее, считает он, надо и дальше влиять на политику с помощью статистики. Исследователи могут блюсти интересы обычного человека, помогая ему избежать манипуляций со стороны правительств, медиа и корпораций.

«С помощью открытого языка R всякий может узнать цену своему дому, автомобилю, супругу и детям — положительную или отрицательную, — говорит он, возможно полушутя. — Это небывалое уравнивание возможностей, Великая хартия вольностей, гарантирующая децентрализацию аналитических прав».

Будучи реалистом, Най признает, что все может пойти по обратному сценарию, по мере того как все больше и больше наших слов и дел учитывается в статистических исследованиях. «Потребительское давление на бизнес как никогда велико, но наука манипуляций и контроля также достигла беспрецедентных успехов», — признает он.

SAS и IBM предсказуемо обратились к R, чтобы не упустить своей доли в революции предсказательной аналитики. Обе компании обещают, что написанные на языке алгоритмы будут доступны в их аналитических средах. «Чем больше аналитического кругозора, тем лучше, — утверждает Энн Милли, старший директор SAS. — Долгое время наука считалась детерминистской, но мы живем в вероятностном мире».

Норманн Най вырос в Сент-Луисе, бросил школу и уехал в Мексику, чтобы стать писателем — он начал публиковаться еще в подростковом возрасте. Вернувшись домой, он изучал социологию и политологию в Университете Вашингтона в Сент-Луисе. Для диссертации в Стэнфорде ему нужно было обсчитать разнородные данные из семи стран.

«Обработать все это руками было невозможно, — говорит Най. — Необходимо было придумать машинный способ». Вместе с Хадлаем Халлом и Дейлом Бентом, докторантом на кафедре исследования операций, он разработал SPSS — быстрый алгоритм обработки разных типов данных. Программа быстро завоевала популярность, и к изобретателям стали обращаться коллеги с просьбой поделиться. Они решили продавать ленты с кодом по $400 — такую сумму младший профессор университета мог потратить без согласования с администрацией.

Переехав в 1969 году в Университет Чикаго, Най продолжил развитие SPSS совместно с Халлом. В 1973 году, выяснив, что в университете появилась прибыльная компания, администрация рекомендовала Наю взять годовой отпуск и заняться ее развитием. В 1975 году безо всяких инвестиций — но с крепкими связями в академической среде, Най и Халл выкупили долю Бента и основали компанию SPSS.

Но сейчас все его заслуги остались позади. «R — это невероятный прогресс по сравнению с той аналитикой, которую разработал я, — говорит Най. — Это возможность изменить правила игры в самой быстроразвивающейся области программирования».

Сейчас профессор работает над книгой о технологиях, изменивших ход истории, вроде печатного станка, хлопкоочистительной машины, противозачаточных пилюль и интернета. Аналитические программы, по его мнению, тоже изменят мир, и мы даже не знаем как именно.

Через дорогу от офиса Revolution Analytics, в Cтэнфорде студенты проходят курс «Элементы статистического анализа», и их 700-страничный учебник наполнен формулами языка R. После выпуска большая часть студентов идет работать в компании вроде Twitter и Facebook.

«Крупные корпорации, производящие тучу данных, интернациональные сообщества, интернет-перевод — все это стирает национальные границы», — говорит профессор. «К чему это приведет — к расцвету индивидуальности или тотальному контролю? У каждой технологии есть обратная сторона».

Новости партнеров
Закрыть
Уведомление в браузере
Будь в курсе самого главного.
Новости и идеи для бизнеса -
не чаще двух раз в день.
Подписаться