Как нейросети помогают обрабатывать фотографии, сортировать огурцы и бурить скважины

Елена Краузова Автор

Технологии машинного обучения и нейросети пришли в потребительские сервисы. Искусственный интеллект скоро научат играть с реальными геймерами и лечить пациентов

Основатель компании ABBYY Давид Ян уверен, что скоро у каждого человека появятся цифровые ассистенты. «Они смогут быстро найти нужный файл в почте или телефон партнера, которого вы встретили на конференции, но не помните его имени», — говорит Ян. Все это уже умеет персональный ассистент Findo, над которым команда предпринимателя работает с 2014 года. Findo анализирует открытую информацию в интернете, содержимое электронной почты, данные из заметок и облачных файлов. В разработки компания ABBYY, по словам Яна, вложила $3 млн, еще $4 млн проект привлек от венчурных и стратегических инвесторов, среди которых Flint Capital и компания Foxit (ведущий поставщик ПО для работы с PDF-документами). В декабре 2016 года у Findo уже было около 65 000 пользователей. «Findo понимает запросы вроде «Найди презентацию от кого-то из Лондона про медицинское страхование, которую я получал пару недель назад», правда, пока только на английском языке, — рассказывает предприниматель. — Но скоро сможет анализировать еще больше типов запросов и находить документы, близкие по смыслу».

Еще несколько лет назад такое распознавание смысла текстов и изображений казалось невозможным. Теперь с подобными задачами справляются все больше приложений, работающих по методам машинного обучения, в том числе глубоких нейронных сетей, как в случае с Findo. Нейросети — обучаемые системы, построенные по аналогии с сетью нейронов у человека. Они дали возможность выполнять задания, для которых очень сложно составить конкретный алгоритм. Нейросети состоят из образующих слои узлов, обрабатывающих информацию. Новая информация меняет состояние всей системы, проходя через слои нейронов. Этот процесс называется обучением нейросети. Алгоритм на основе нейросетей, например, может анализировать множество текстов на каком-либо языке и автоматически группировать слова, близкие по смыслу, определять смысловую тональность текста, вычленять конкретные сущности и отношения между ними.

Приручение машин

Об алгоритмах машинного обучения активно заговорили в 2016 году, когда бизнес стал использовать их в приложениях, понятных потребителям. Например, компания DeepMind, купленная Google более чем за $500 млн, снизила расходы на охлаждение дата-центра корпорации на 40%. Теперь DeepMind хочет научить искусственный интеллект сражаться в Starcraft II с реальными геймерами. Cуперкомпьютер IBM Watson, читающий 200 млн страниц за три секунды, будет систематизировать данные в сфере здравоохранения, 80% которых сегодня даже не принимаются в расчет при лечении пациентов. Алгоритмы машинного обучения позволили Microsoft сделать систему для предсказания результатов матчей чемпионата Европы по футболу. Facebook использует машинное обучение для распознавания лиц на фото, анализа текстов и их переводов. В сентябре 2016 года Google, Facebook, Amazon, IBM и Microsoft объединили усилия для создания искусственного интеллекта, который позволит им обмениваться данными.

Фото Getty Images роб Хай, главный технический директор IBM Watson, верит, что машинное обучение поможет в борьбе со многими болезнями

Впервые методы машинного обучения появились в середине XX века. Суть их в том, что система не программируется заранее, а обучается в процессе работы, анализируя информацию об объектах и их признаках, соотнося их друг с другом. Система может учиться с учителем (когда ей дают правильные ответы) или без него (когда у нее есть только сырые данные). Каждый вид обучения предполагает, что объекты группируются в обучающей выборке по-разному. Отличаются и механизмы определения признаков, и то, как система определяет правильность своего решения.

Одним из самых известных методов машинного обучения стали искусственные нейросети. Модель перцептрона Розенблатта (нейросети, математической модели восприятия информации мозгом) была предложена в конце 1950-х, а элементы архитектуры нынешних нейросетей появились в 1990-е годы. Но только в последнее время нейросети научились решать сложные задачи. Например, они дали новые возможности развития для поиска изображений в интернете, распознавания речи в смартфонах, машинного перевода, копирования стилей. В приложениях вроде Prizma нейросети переносят стиль художника на загруженное фото. Компания Sony с их помощью стилизовала музыку Бетховена под The Beatles, бразильскую гитару и лаундж. Программа Google Deep Dream раскладывает фотографии на слои, распознает известные ей признаки и утрирует их. Так, алгоритмы Google из-за особенностей данных, использованных при обучении, на всех изображениях видят рыб и собак. За этими экспериментами последуют и более полезные применения нейросетей.

В работе нейросетей все активнее используется метод обучения с подкреплением. Суть его в том, что система, проводя анализ, не получает ответ, правильно ли она приняла решение. За счет этого она постоянно анализирует меняющиеся данные и формирует собственную стратегию поведения, чтобы выполнить поставленную задачу. Система каждый раз оценивает, удалось приблизиться к цели или же она стала дальше (положительное/отрицательное подкрепление). Каким именно образом программа формирует нужную стратегию и как оптимально сконструировать нейронную сеть, пока не до конца понятно. С развитием технологии машинного обучения с подкреплением разработчики связывают создание искусственного интеллекта. Сегодня ставку на этот метод делают некоммерческая организация Open AI, созданная Илоном Маском, и компания DeepMind, представившие свои платформы для тренировки алгоритмов обучения с подкреплением (инструментарий Open AI так и называется — Gym), где можно теоретически сформировать для программы окружение для подкрепления на основании любой информации из интернета.

Широкая сеть

С чем связан бум нейросетей? «До 2010 года не было понимания, что размер и глубина нейросетей имеют принципиальное значение для качества их работы, — говорит Давид Ян. — Проводить эксперименты с глубокими сетями было практически невозможно из-за малого размера оперативной памяти и слабой производительности компьютеров». Сегодня мощности персональных компьютеров позволяют создавать модели для обучения нейросетей большего размера и глубины. Кроме того, дата-аналитики научились создавать нейронные сети на видеокартах (GPU), позволяющих проводить параллельные вычисления. Благодаря массовому распространению мобильного интернета и портативных устройств появился большой массив текстовых, графических, видео- и других данных, на их базе можно обучать нейросети. Развитие интернет-сервисов и электронной коммерции создало спрос на технологии искусственного интеллекта для извлечения информации из массивов данных.

«Неправильно рассматривать нейросети как панацею, во многих случаях использовать другие методы машинного обучения все еще намного выгоднее», — уверен Григорий Сапунов, сооснователь стартапа Intento. По его словам, нейросетям нужен большой массив данных, которые могут быть в дефиците. Еще одна проблема для разработчиков — отсутствие вычислительных мощностей для решения сложных задач. Есть и третья сложность. «Если нужно научить систему рассуждать или объяснить полученный результат, то лучше использовать не нейросети, а другие методы, например экспертные системы», — добавляет предприниматель.

Сапунов и его партнер Константин Савенков работают в Intento над поисковиком, который, в отличие от других, сможет искать не текстовую информацию или профили в социальных сетях, а интерактивные объекты — публичные чаты и чат-боты в Facebook, Telegram, Viber и ICQ. У Intento, получившего более $210 000 от одного из российских бизнес-ангелов, более 550 000 пользователей в месяц. Разработчики планируют сделать поиск доступным не только людям, но и программам, которые будут находить там программные интерфейсы (API) и взаимодействовать с ними без помощи человека. «Сейчас у каждого на смартфоне 4–5 мессенджеров, им на смену, скорее всего, придут программы-ассистенты, которые сами будут решать, по каким каналам передавать сообщения, — говорит Савенков. — Они будут подбирать подходящие внешние сервисы и взаимодействовать с ними с помощью нашей платформы». Базовый доступ будет бесплатным, а разработчики программ будут платить Intento комиссию при взаимодействии с платными сервисами, рассчитывают создатели проекта.

Читать также: Сверхразум как бизнес-идея: российские стартапы могут сделать прорыв в машинном обучении

«Нейросети, ставшие для многих чем-то вроде магии, — это все-таки технология завтрашнего дня, а не сегодняшнего», — говорит Михаил Фирулик, директор по продуктам направления «Большие данные» Mail.ru Group. В компании с помощью машинного обучения строят и обучают модели, способные предсказывать поведение интернет-пользователей. Например, Mail.ru Group помогает Ozon.ru персонализировать главную страницу под интересы покупателей. С использованием нейросетей индекс соответствия контента интересам пользователей вырос в полтора раза. Помимо этого, в Mail.ru Group работают с предикативной аналитикой для банков. Конверсию по кредитам в интернете удалось приблизить к показателям в отделениях банков, хотя онлайн-заявки в два-три раза реже превращаются в выданные кредиты.

«Яндекс» создал подразделение по работе с большими данными Data Factory в 2014 году и использует машинное обучение в проектах. В 2015-м компания помогала Центробанку искать нелегальных кредиторов, вместе с AstraZeneca запустила платформу для диагностики рака, создала алгоритм для предсказания увольнений сотрудников. Летом 2016 года система, созданная в «Яндексе» для Магнитогорского металлургического комбината, помогла оптимизировать расходы на ферросплавы и другие материалы на 5% (экономия — более $4 млн ежегодно). С нейросетями в «Яндексе» тоже работают, они применяются для улучшения качества поиска. «Шумиха, которая поднялась в этом году вокруг искусственных нейросетей, пошла на благо, — говорит Александр Крайнов, руководитель службы компьютерного зрения и технологий машинного интеллекта «Яндекса». — Чем больше разговоров и интереса, тем больше инвестиций, исследований, стартапов».

Молодые компании действительно приходят на новый рынок. Например, стартап Nest Lab из Уфы с помощью машинного обучения позволяет повысить точность подбора мероприятий на нефтяных скважинах. Для каждой скважины самообучающиеся алгоритмы программы-робота Nest определяют взаимосвязь между входными параметрами и конечным результатом. «Отдельный алгоритм отвечает за утверждение входных данных. Раньше суточные замеры не совпадали с итоговыми месячными на 15–25% в среднем по России, а с Nest погрешность падает до 1%», — объясняет Тимур Имаев, директор по маркетингу Nest Lab. Из-за накапливающихся ошибок в расчетах компании при бурении упираются в обводненные зоны. Стартап уже запустил три пилота с нефтяниками в Западной Сибири, где рекомендации Nest Lab, как надеется Имаев, смогут дать прирост 30–50%.

Фото Connie Zhou·Google Два года назад для анализа работы систем охлаждения дата центра Google стал использоать машинное обучение

Читать также: Железные данные: как промышленники дают заработать IT-компаниям

Машинное обучение и нейросети все шире используются в повседневной жизни. Японский инженер Макото Койке развернул на ферме своих родителей сортировочный конвейер для огурцов, где нейросети помогают классифицировать каждый овощ по фото в зависимости от его длины, спелости и колючести. Койке использовал открытое решение Google для работы с нейросетями и достиг 70%-ной точности распознавания огурцов на фото, натренировав алгоритм на 7000 изображений. Национальное управление океанических и атмосферных исследований США теперь следит за 447 североатлантическими гладкими китами (именно столько осталось на планете) со спутников. Система была создана после того, как нейросети помогли участникам конкурса на платформе Kaggle распознать китов на тысячах фотографий, сделанных в разных океанах, в разное время суток, в разную погоду. Какие новые задачи возьмутся решить с помощью машинного обучения и нейросетей корпорации и стартапы? Аналитическая компания Gartner называет технологии искусственного интеллекта главным полем битвы до 2020 года.