К сожалению, сайт не работает без включенного JavaScript. Пожалуйста, включите JavaScript в настройках вашего броузера.

Жизнь после Siri: что будет с технологией распознавания речи в будущем

фото Getty Images
фото Getty Images
Независимый разработчик Nuance, чьи технологии используются в смартфонах, работает над новым проектом виртуального ассистента и при этом отбивается от Apple, Google и инвестора-активиста Карла Айкана

В сверкающем офисе компании Nuance Communications, специализирующейся на распознавании речи, одна комната переделана в уютную берлогу. Исполнительный директор Шон Браун хвастается следующим большим проектом Nuance — виртуальным ассистентом под названием Wintermute, работа над которым ведется уже больше года.

«Как играет Пол Пирс?» — он задает вопрос Android-смартфону об одном из звездных игроков НБА. Женский голос с компьютерными нотками отвечает: «В сегодняшней игре Пол Пирс принес команде 13 очков и сделал три результативные передачи». Wintermute загрузил все запросы Брауна на серверы Nuance, и когда позже Шон усаживается в гостиной на диван и говорит ТВ, со встроенным Wintermute-сервисом, «включай игру», тот проверяет его профайл и выбирает матч Boston Celtics (летом Пол Пирс стал игроком Brooklyn Nets. — Forbes).

Именно таким образом Nuance планирует изменить наш стиль общения с машинами — собирать данные о потребителе на облачном «мозге», чтобы качественнее предугадывать его потребности и передавать их от машины к машине.

Для того, чтобы Wintermute стал по-настоящему успешным проектом, Nuance должна отменить ряд сложных лицензионных сделок с потенциальными конкурентами — это позволит технологии следовать за пользователями повсюду от дома до машины и офиса. «Нам нужно очень тесно работать с производителями смартфонов, планшетов и телевизоров, — говорит генеральный директор Nuance Пол Риччи. — Технология должна раствориться в системе». Он рассчитывает, что на это уйдет пять лет. Будет ли сложно уговорить игроков вроде Samsung или eBay открыть свои системы для Nuance, чтобы она могла использовать их данные? «Нет, — считает креативный директор Nuance Гэри Глэйтон. — Мы — Швейцария. Мы — нейтральны. Мы играем со всеми. Все сядут с нами в одну лодку». В eBay, кажется, в этом не уверены. «Мы не делимся своими данными с третьими сторонами», — заявил представитель компании на вопрос о сотрудничестве с сервисами вроде Wintermute.

 

Nuance прежде была известна по продуктам марки Dragon Dictation, но теперь ее технологии распознавания речи используются в iPhone (виртуальный ассистент Siri), Samsung S-Voice, автоматизированных колл-центрах и виртуальных онлайн-ассистентах авиалиний и банков. В 2012 финансовом году при выручке $1,7 млрд компания заработала свыше $200 млн чистой прибыли. Отличный результат? Не совсем.

Проблема в том, что Google и Apple следуют по стопам Nuance. Apple недавно запустил исследовательский центр в Бостоне (это всего 15 миль от основного офиса Nuance в Берлингтоне, штат Массачусетс), где как раз бывшие инженеры Nuance работают над версией Siri, свободной от технологий Nuance. В перспективе их разработка может вытеснить Nuance из iPhone таким же путем, как Google Maps вытеснил все другие картографические сервисы и стал номером один по умолчанию.

 

Технология Google «речь-плюс-искусственный-интеллект» лучше всего показала себя в Google Now: получился своего рода голосовой серфинг по сети. Если технология Nuance основана на методах статистического анализа (для распознания слова сервис обращается к фонемам и контексту), то Google движется к так называемой технологии глубокого обучения, за разработку которой отвечает большой энтузиаст «искусственного интеллекта» Джефри Хинтон. Google нанял его в начале 2013 года, и подход Хинтона обещает превосходные результаты. Что еще хуже для Nuance — разработчики приложений на Android получат программное обеспечение Google по распознаванию речи бесплатно, тогда как Nuance берет лицензионную плату. Google также не отстает от Apple в том, что активно рекрутирует сотрудников Nuance.

Генеральный директор Nuance Пол Риччи возглавляет компанию уже 13 лет и готов к предстоящей битве за «управляемую голосом» сеть. Риччи — прирожденный боец, известный в Долине умением закрывать сделки как ему выгодно: «Когда ты управляешь компанией, единственное, о чем стоит беспокоиться, так это о создании долгосрочных перспектив и стоимости».

Если Wintermute не станет мостом в будущее, как предполагают топ-менеджеры Nuance, то Риччи придется рассуждать не о долгосрочных перспективах, а думать о заключении сделки. «Nuance находится в патовой ситуации, — говорит источник Forbes. — Им нужно продаваться». Ходят слухи, что Apple уже делала попытки инициировать переговоры c Nuance в мае 2011 года, но тогда Риччи дал категорический отпор. Источник в Google утверждает, что перед тем как в компании начали развивать собственную технологию, речь шла о покупке Nuance за $6 млрд.

 

Инвестор Карл Айкан, известный умением входить в компании и зарабатывать на сделках десятки и сотни процентов, собрал уже 16% акций Nuance. Кроме того, недавно он признался, что держит большую позицию в Apple. Айкан пока никак себя не проявил в Nuance, но аналитики считают, что это вопрос времени — инвестор, скорее всего, потребует продажи части небольших активов, а Риччи может быть предъявлен ультиматум освободить один из двух его постов (Риччи не только гендиректор, но и председатель совета директоров). Главная же цель Айкана — продажа Nuance, необязательно Apple или Google, покупателем может стать и IBM. 

19 августа совет директоров Nuance принял «план о правах акционерах», который усложняет получение контроля над компанией. Более того, он фактически начнет работать против любого крупного акционера, собравшего 20% и более акций, если такая сделка не будет одобрена советом директоров. Хотя в документе не называется имя Айкана, действия совета, естественно, направлены против него. Nuance не первая компания, пытающаяся отбиться от активного инвестора и его юристов, но у большинства это не получается. В любом случае Риччи и его топ-менеджерам придется вести битву сразу на два фронта: внешний — против Google и Apple и внутренний — против Айкана.

Время пока есть. Риччи считает, что пройдет от 10 до 20 лет, прежде чем общение с компьютером распространится в массы, а технология станет настолько хорошей, чтобы предвосхитить наши ожидания. Но готовы ли акционеры Nuance ждать обещанных «долгосрочных перспектив»?

Мы в соцсетях:

Мобильное приложение Forbes Russia на Android

На сайте работает синтез речи

иконка маруси

Рассылка:

Наименование издания: forbes.ru

Cетевое издание «forbes.ru» зарегистрировано Федеральной службой по надзору в сфере связи, информационных технологий и массовых коммуникаций, регистрационный номер и дата принятия решения о регистрации: серия Эл № ФС77-82431 от 23 декабря 2021 г.

Адрес редакции, издателя: 123022, г. Москва, ул. Звенигородская 2-я, д. 13, стр. 15, эт. 4, пом. X, ком. 1

Адрес редакции: 123022, г. Москва, ул. Звенигородская 2-я, д. 13, стр. 15, эт. 4, пом. X, ком. 1

Главный редактор: Мазурин Николай Дмитриевич

Адрес электронной почты редакции: press-release@forbes.ru

Номер телефона редакции: +7 (495) 565-32-06

На информационном ресурсе применяются рекомендательные технологии (информационные технологии предоставления информации на основе сбора, систематизации и анализа сведений, относящихся к предпочтениям пользователей сети «Интернет», находящихся на территории Российской Федерации)

Перепечатка материалов и использование их в любой форме, в том числе и в электронных СМИ, возможны только с письменного разрешения редакции. Товарный знак Forbes является исключительной собственностью Forbes Media Asia Pte. Limited. Все права защищены.
AO «АС Рус Медиа» · 2024
16+
Наш канал в Telegram
Самое важное о финансах, инвестициях, бизнесе и технологиях
Подписаться

Новости