К сожалению, сайт не работает без включенного JavaScript. Пожалуйста, включите JavaScript в настройках вашего броузера.
Наш канал в Telegram
Самое важное о финансах, инвестициях, бизнесе и технологиях
Подписаться

Новости

Школа молодого миллиардера: как продать «читалку» для сканов

Diomedia
Diomedia
Основатель стартапа Shuffle Reader Рамиль Хайруллин о том, как сделать бизнес из учебного проекта

Корпуса Казанского университета занимают несколько кварталов в центре города. В одном из них, Институте вычислительной математики и информационных технологий, и родился Shuffle Reader. Он начинался как учебный проект, и появился во многом из-за лени студентов.

Перед каждым учебным годом студентам выдают литературу. Обычно получается несколько сумок, забитых до отказа книгами весом 10-15 кг. А еще нужны методички и задачники. Все, что можно не носить, оставляют дома. И то, что нельзя не носить, тоже. Вместо бумажных книг студенты используют их отсканированные копии. Но здесь возникает просто набор фотографий, с которыми сложно работать. Мы попробовали устранить это неудобство.

Над проектом работаю я и мои одногруппники  Рамиль Габдрахманов и Азат Зулькарняев. Когда нам предложили придумать собственный проект, я вспомнил про книги. Идея заключалась в том, чтобы оптимизировать отсканированные книг под планшеты и смартфоны.

 

Как пройти в библиотеку?

Оказалось, идея не нова: одни обрезали края книги и увеличивали таким образом размер шрифта, другие распознавали, а потом исправляли ошибки, третьи перестраивали документ на компьютере и создавали новый документ с крупным шрифтом. Я же хотел, чтобы любой документ можно было перестроить под экран без особых усилий.

Мы решили «разрезать» документ на иллюстрации и текст, увеличивать и снова собирать так, чтобы текст помещался на экран. Сначала надо было найти бесплатную библиотеку распознавания текста для того, чтобы автоматизировать «разрезание».

 

Мы перепробовали множество продуктов. Оказалось, что большинство бесплатных библиотек распознавания не совместимы с мобильными платформами. Часто разработки решали узкую задачу, поэтому их библиотеки мы использовать не могли. В конце концов мы обратили внимание на библиотеку Tesseract, которую совершенствуют программисты всего мира. Испытав её, мы поняли, что можем решить проблему сами. Мы написали библиотеку, которая хоть и не могла превращать слова в текст, но быстро и уверенно находила их. Нам этого было достаточно.

На следующем этапе нужно было научиться обрабатывать документ. При сканировании текстов появляются искажения, связанные с неровным положением листов, которые для компьютера становятся непреодолимым препятствием. Поначалу мы такие документы не брали в обработку, но в процессе изучения библиотек, работающих с распознаванием изображений, поняли, что с проблемой справились до нас и воспользовались готовым решением. Конечно, всегда можно создать такой «испорченный» документ, который ни одна программа не сможет обработать, но наиболее распространенные помехи, как например документы, отсканированные под углом, обрабатываются. Программа определяет угол поворота документа и поворачивает изображение.

Мобильная адаптация

Последний этап заключался в адаптации программы для мобильного телефона. Самым простым и дешевым для нас вариантом было создание приложения для Android. Первую тысячу скачиваний набрали за две недели и решили протестировать приложение в Yandex.Store. Мы договорились, чтобы нас выделяли на главной странице на условии, что мы не публикуемся на других магазинах в течение двух недель. Кстати, первые положительные отзывы и письмо с благодарностью мы получили именно на Yandex.Store. 

 

На обработку одной страницы текста наш первый прототип тратил примерно полторы минуты, иногда казалось, что он зависает. Наш преподаватель предложил поставить крутящийся значок, чтобы успокоить пользователя. Мы сдали проект как командную курсовую работу. Преподаватель принял и сказал, чтобы после сдачи проекта в университете, мы должны довести его до рыночного образца. Мы согласились.

Позже мы вносили изменения и улучшали программу  как в плане дизайна и быстроты. К лету 2014 года был готов второй прототип – более живописный и способный работать с большим количеством документов, а главное втрое быстрее первого - 30 секунд на страницу текста. Скорость удалось увеличить потому, что движок не делал лишних операций, а решал конкретную упрощенную задачу. На данный момент у нас порядка 15 000 скачиваний на Android и iOS.

Сейчас мы пытаемся определить нашу целевую аудиторию и ищем коммерческую библиотеку, которая позволит преобразовывать в удобный формат более сложные по структуре документы. 

Мы в соцсетях:

Мобильное приложение Forbes Russia на Android

На сайте работает синтез речи

иконка маруси

Рассылка:

Наименование издания: forbes.ru

Cетевое издание «forbes.ru» зарегистрировано Федеральной службой по надзору в сфере связи, информационных технологий и массовых коммуникаций, регистрационный номер и дата принятия решения о регистрации: серия Эл № ФС77-82431 от 23 декабря 2021 г.

Адрес редакции, издателя: 123022, г. Москва, ул. Звенигородская 2-я, д. 13, стр. 15, эт. 4, пом. X, ком. 1

Адрес редакции: 123022, г. Москва, ул. Звенигородская 2-я, д. 13, стр. 15, эт. 4, пом. X, ком. 1

Главный редактор: Мазурин Николай Дмитриевич

Адрес электронной почты редакции: press-release@forbes.ru

Номер телефона редакции: +7 (495) 565-32-06

На информационном ресурсе применяются рекомендательные технологии (информационные технологии предоставления информации на основе сбора, систематизации и анализа сведений, относящихся к предпочтениям пользователей сети «Интернет», находящихся на территории Российской Федерации)

Перепечатка материалов и использование их в любой форме, в том числе и в электронных СМИ, возможны только с письменного разрешения редакции. Товарный знак Forbes является исключительной собственностью Forbes Media Asia Pte. Limited. Все права защищены.
AO «АС Рус Медиа» · 2024
16+