03.02.2011 00:00

Без барьеров

Андрей Бабицкий Forbes Contributor
Машины будут способны обеспечить наше бытовое общение на любом языке уже в ближайшем будущем

В декабре в онлайн-магазине App Store появилось приложение-переводчик Word Lens, работающее в жанре, которое его создатели называют «расширенной реальностью»: оно позволяет накладывать текст на живую картинку в видоискателе iPhone. Пользователь наводит камеру смартфона на табличку или указатель на иностранном языке, приложение распознает надпись, переводит и вписывает обратно уже на понятном языке. Программа наделала много шума, несмотря на то что с потребительской точки зрения выполнена не слишком удачно. Во-первых, основную функциональность надо докупать внутри якобы бесплатного приложения, во-вторых, оно переводит только с английского на испанский ($10) и обратно (еще $10). Наконец, первые пользователи Word Lens обнаружили в приложении множество ошибок.

Но даже если Word Lens не полноценный электронный переводчик, а только интерфейс для него, приложение вполне заслуживает внимания. Удобный интерфейс — это как раз то, чего не хватает для создания настоящего универсального переводчика.

Известно, что компьютеры переводят отвратительно. Сервис Google Translate стал в русском языке нарицательным именем для плохого перевода. Тем не менее он пользуется популярностью. Ведь хотя компьютеры и не умеют переводить хорошо, они все-таки умеют это делать. Google не справится с художественным текстом, но сможет перевести описание стиральной машины в голландском интернет-магазине и тем более фразу «положить в корзину».

Все сайты в интернете сделаны более или менее единообразно. Единообразно сделаны дорожные указатели, ресторанные меню, памятки клиентам в гостиницах, прайс-листы и еще множество надписей, необходимых людям в каждодневной жизни.

Все письменные данные, которые могут понадобиться туристу, командированному или посетителю магазина, — это конечный объем информации, и не слишком большой. Чтобы переводить эту информацию на ходу, нужен даже не алгоритм, а база данных, приделанная к удобному интерфейсу, такому как в Word Lens. Составить исчерпывающий каталог географических названий, инструкций, указателей и распространенных слов — это не технологическая задача, которая может быть решена, например, при помощи краудсорсинга.

Все это относится и к устной речи. В январе Google вставил в свое мобильное приложение Translate «разговорный режим» — телефон распознает устную речь, переводит ее и произносит вслух. Приложение не сможет перевести конференцию по молекулярной биологии, но позволит заказать по телефону номер в мексиканской гостинице или договориться о сроках поставки партии цветов из Эквадора.

Google Translate понимает полсотни языков, на слух воспринимает 15, а разговорный режим работает только при переводе с английского на испанский (как и в Word Lens). Но количество языков и качество перевода будет расти благодаря разработчикам и пользователям, которые могут предлагать свои варианты перевода.

Алгоритмы Google не понимают иноязычную грамматику. Они работают статистически: смотрят, как переводятся те или иные конструкции в уже переведенных текстах. Этот подход гарантирует, что компьютеры не смогут работать с художественными текстами. Но его вполне достаточно, чтобы они переводили простые деловые и бытовые разговоры. Машинный перевод для решения большинства реалистичных задач должен появиться уже совсем скоро. А достижение совершенства не только невозможно, но и никому не нужно: едва ли кто-нибудь будет читать машинный перевод Достоевского, даже грамматически безупречный.

Новости партнеров