всухую, у 'Евфрата' - менее разительно, но тоже безусловно. Четвертая версия FineReader’а - во всяком случае, для моих довольно скромных задач: оцифровки некоторых бумажных книг и распознавания обложек компакт-дисков, - казалась мне практически идеальной, и с тех пор я, хоть и менял версии по мере их выхода, принципиального изменения в этой части моей жизни не замечал. Но, конечно, каждая следующая версия была хоть чем-нибудь, да совершеннее предыдущей, и по поводу каждой авторы писали, что точность распознавания повысилась на столько-то и столько-то процентов. Насчет процентов я понимал (и понимаю до сих пор) очень мало: четвертая (если не третья) версия распознавала хороший типографский текст буквально стопроцентно, так что добавлять процентики к этой сотне получалось, как при подсчете голосов у нас на выборах где-нибудь на Кавказе, - а если тексты были, что называется, неудобными - точность распознавания зависела скорее от степени этого неудобства, чем от версии. Единственная претензия, которую я стал высказывать FineReader’у, после того как изумление от самого факта распознавания стало несколько утихать, - это некоторая его глупость - в том смысле, что, не разобрав, например, в списке одну из циферок, он не умел догадаться, что это список и, стало быть, непонятная фигура между шестеркой и восьмеркой должна быть, безусловно, семеркой.

Девятая версия получила новый интерфейс, соответствующий интерфейсной моде (ну, как у автомобилей), и - по пресс-релизу - добрые два десятка добавок: повышенная точность сохранения оформления документов, определение и восстановление логической структуры документа, сохранение колонтитулов, нумерации страниц и подписей к картинкам, автоматическое распознавания языка… и еще много подобных мелких приятностей, наверное, важных для перевода в цифру кипы каких-нибудь там документов, но не слишком существенных при редком распознавании отдельных художественных книжек. Другими словами, 'девятка' принесла больше радостей корпоративным пользователям, нежели пользователям домашним. Впрочем, для домашних тоже появились свои удовольствия - вроде, например, режима распознавания повышенной точности, когда плохо пропечатанные буковки или жирное пятно на странице перестают быть непреодолимой преградой.

Голубицкому 'девятка' вообще очень понравилась, так что о ценности этих нововведений, думаю, вам скоро будет поведано в 'Голубятне', не стану отбивать хлеб. Что же касается поумнения (в смысле списков с обложек компакт-дисков), - я не заметил, чтобы в ABBYY особенно в этом направлении работали, - да и бог с ним.

Дело в том, что я почти перестал эти списки распознавать: приобретая новый диск, ты мгновенно находишь информацию с его обложки (и зачастую - даже гораздо больше информации) в Интернете, уже в цифровом виде. И это, кстати, относится отнюдь не только к дискам. По мере течения нашего цифрового времени все меньше оказывается надобностей в оцифровке текстов: книга попадает в Сеть либо (чаще всего) сразу в цифровом виде, либо сканируется и оцифровывается любителями раньше, чем возникает потребность получить ее как файл на свой КПК или Sony Reader. И хотя, как и прежде, я числю FineReader программой в числе первых, устанавливаемых на голую систему, - обращаться к нему стал все реже и реже.

И тут меня посетило интересное наблюдение: постоянно совершенствуясь в области распознавания текстов, ABBYY работает на концептуально, по вектору, отмирающем направлении. Число еще не переведенных в цифру культурных текстовых ценностей постоянно уменьшается, стремясь в пределе к нулю, новые текстовые ценности

Добавить отзыв
ВСЕ ОТЗЫВЫ О КНИГЕ В ИЗБРАННОЕ

0

Вы можете отметить интересные вам фрагменты текста, которые будут доступны по уникальной ссылке в адресной строке браузера.

Отметить Добавить цитату