HTML
Вся линейка FineReader обучена распознавать не только отсканированный текст, но и графические изображения, содержащие буквы и цифры (поддерживаются форматы BMP, TIFF, PNG, DCX и PCX). Сергей Костенок заранее усложнил задачу, предложив «скормить» программе обложку одного из продуктов ABBYY
Неизвестно почему программа отказалась распознавать и логотип своей компании, а его, по логике, можно смело рассмаривать как графический блок. Ну да ладно: не зря в программном окне красуется здоровенная кнопка «Профессиональная версия». Похоже, снобизм части пользователей по отношению к «урезанным» версиям вполне оправдан?.. Давайте разбираться.
Российская разработка CuneiForm 2000 компании Cognitive Technologies (16 Мбайт, $129) призвана выполнять те же задачи, что и FineReader. Демо-версия CuneiForm 2000 рассчитана на 100 запусков или на использование в течение 30 дней и позволяет распознавать тексты на русском, английском, русско-английском, немецком и французском языках (в нее не входят 15 дополнительных языковых библиотек). На сайте разработчиков предлагаются два варианта программы: CuneiForm 2000 R2 с русским интерфейсом и CuneiForm 2000 Professional (английский интерфейс). В списке поддерживаемых операционных систем нет Windows 2000/XP. При установке CuneiForm 2000 R2 в среде WinXP приложение выдало ошибку и тихонько испустило дух. Правда, при установке в раздел FAT32 (Windows 98SE) все прошло благополучно. Оказалось, что сей продукт не работает в среде Windows 2000/XP (что неудивительно, ведь число 2000 в названии означает год появления продукта). Комментарии излишни…
Readiris Pro 7 – профессиональная программа. По словам производителей (20 Мбайт, $130), для данной OCR характерна высочайшая точность преобразования обычных печатных документов (письма, факсы, журнальные статьи, газетные вырезки) в объекты, доступные для редактирования (включая файлы PDF). Работает со всеми версиями Windows. Поддерживаются 92 языка, включая русский.
OmniPage 11 ($600), продукт компании ScanSoft. Разработчики утверждают, что их программа практически со 100% точностью распознает печатные документы, восстанавливая их форматирование, включая столбцы, таблицы, переносы, заголовки, названия глав, подписи, номера страниц, сноски, параграфы, нумерованные списки, красные строки, графики и картинки. Есть возможность сохранения в формат Microsoft Office, PDF и в 20 других форматов, распознавания из файлов PDF и редактирования в формате PDF.
Судя по размеру дистрибутива и стоимости продукта – 115 Мбайт и 1100 рублей – есть все основания надеяться на более качественную работу. Параметры установки те же, что и в ABBYY FineReader 6.0 Sprint, за исключением лишь двух языков установки (и, следовательно, интерфейса) – русского и английского. Не забывайте о колоссальном числе языков распознавания и в меню отметьте лишь необходимые, отбросив заведомую экзотику.
Окно домашней версии почти ничем не отличается, и, разумеется, кнопка «Профессиональная версия» никуда не исчезла
Так в чем же разница? Ответ получим после сканирования «бумажного» документа (параметры сканирования ничем не отличаются от «спринтерских»). Результат гораздо лучше: текст полностью окружен зеленой границей блока, вот, разве что, с рукописной частью документа снова вышла накладка (рис. 9).
Но мы уже знаем, как исправить такое недоразумение.
По умолчанию предлагается русский язык распознавания, но, как вы помните, при сканировании документа, содержащего смесь латиницы и кириллицы, ничего хорошего не выйдет. Однако цена продукта себя должна оправдать: зайдите в меню Язык · Выбор нескольких языков и в открывшемся окне «Язык распознаваемого текста» поставьте флаг в переключателе «Русско-Английский» (рис. 10).
Теперь смело нажимайте кнопку «Распознать», радуйтесь абсолютно корректному результату, после чего сохраняйте сканированный документ в удобный для вас формат.
Точно так же, как и в ABBYY FineReader 6.0 Sprint, вам придется активировать опцию экспорта распознанного текста в HTML-формат, а для конвертации в PDF использовать «великий и ужасный» Adobe Acrobat – встроенный PDF-инструментарий отсутствует и в домашней версии. Лучше программа справилась и с распознаванием сложного графического файла с обложкой
С точки зрения функциональности Home-версия отличается от «Спринта» лишь одним: функцией выбора комбинации английского и русского языков распознавания. Безусловно, для части пользователей такая возможность более чем актуальна. Кроме того, даже наш небольшой тест показывает, что алгоритмы работы программ так же отличаются: так, лучше работает автоматическое выделение блоков, что уменьшает необходимость ручной подгонки. Осталось узнать, чем же столь хороша профессиональная версия, столь рекламируемая разработчиком. «Вскрытие» покажет.
Уж здесь-то все должно быть замечательно. А как же иначе? Аккурат – 383 Мбайта дистрибутива и цена 3700 рублей. Впрочем, можно загрузить испытательную версию (40,5 Мбайт), лишенную дикого количества языков распознавания, их при необходимости без труда можно загрузить с сайта компании. Мы же займемся установкой «коробочной» версии программы.
Что вы скажете о девятнадцати языках установки продукта? Согласен, мало кому из русскоязычных пользователей понадобятся эстонский или турецкий языки инсталляции. Зато следующий шаг оценят многие: меню выборочной установки предлагает несколько языковых вариаций программного интерфейса (рис. 11).
Кроме того, по вашему желанию будут установлены «Руководство пользователя» в формате PDF, обучающие примеры и утилита ABBYY Screenshot Reader, способная распознавать текст не просто со скриншотов, являющихся графическими файлами (два предыдущих приложения умели «читать» графику), а непосредственно с экрана компьютера. Заманчиво.
Настоящий профессионализм не терпит суеты и спешки: установка FineReader 8.0 Professional Edition длится гораздо дольше своих «младших» собратьев – около пяти минут. При первом запуске софтины