03.10.2010 00:00

Данные — в помойку

Ли Гомес Forbes Contributor
Ян Берд стирает информацию, на получение которой потрачены миллиарды долларов

TMI (too much information) — такое короткое сообщение обычно отправляет подросток на мобильный телефон приятелю, который говорит больше, чем от него хотят услышать. Этой же аббревиатурой можно охарактеризовать и одну из проблем, с которой столкнулись Ян Берд и его коллеги, работающие на большом адронном коллайдере на французско-швейцарской границе.

Работа коллайдера состоит в том, чтобы разгонять элементарные частицы почти до скорости света, сталкивать их — и фотографировать эти столкновения. Для несведущего человека эти снимки всего лишь скопище загогулин и закорючек. А специалистам, занимающимся, подобно Берду, физикой элементарных частиц, эти фотографии должны помочь разобраться в структуре материи и понять, как устроена Вселенная.

В коллайдере установлено пять детекторов высотой с пятиэтажный дом, которые фиксируют столкновения частиц. Работают они как гигантский цифровой фотоаппарат: оснащенные в общей сложности 150 млн сенсоров, детекторы ежесекундно делают по 40 млн снимков. 55-летний Берд, главный компьютерщик проекта, утверждает, что детекторы фиксируют гораздо больше данных, чем в состоянии обработать его компьютеры. Информации столько, что она могла бы заполнить собой самый большой жесткий диск за долю секунды. Но поскольку никто точно не знает, что делать с таким количеством информации, главное в работе с коллайдером, по словам Берда, «состоит в том, чтобы научиться понимать, от какой информации можно избавиться. Большая ее часть не представляет никакого интереса».

Представьте себе видеокамеру, которая всю ночь следит за входом в магазин. Сотрудникам магазина, которые заступят утром на смену, не надо прокручивать все 12 часов записи; достаточно просмотреть только заинтересовавшие их фрагменты. Но это легче сказать, чем сделать: ведь не сразу разберешь, что это за подозрительное пятно на экране — грабитель или всего лишь тень от проезжавшей мимо машины.

Чтобы научиться отличать сигналы коллайдера от «шума», потребуется время, говорит Берд. Поскольку коллайдер — агрегат сравнительно новый (он был запущен в ноябре прошлого года) и ученые пока не разобрались во всех его особенностях, они поначалу будут отсеивать информацию осторожно. Набравшись опыта, станут гораздо увереннее отделять зерна от плевел. Рано или поздно они научатся сохранять только «главные хиты». Но даже после избавления от всего «шума» компьютеры Берда будут сохранять до 15 петабайт информации в год. Чтобы записать такой объем данных на DVD, понадобится стопка из 1,7 млн дисков.

«Нужно быть уверенным в том, что в собранную информацию не затесались ошибки», — говорит Берд. И поскольку ученые работают на неизвестной им территории, добавляет Берд, «потребуется очень много молодых исследователей».

Новости партнеров