LizardTech Document Express Editor - великолепная программа для создания, редактирования, и чтения документов формта DjVu.
В сборке модули OCR - оптического распознавания текста для русского и английского языков.
Одна из наиболее распространенных программ для создания и просмотра DjVu-документов на локальном компьютере
– программа компании LizardTech Document Express Editor. Правда,
в отличие от плагина для браузера программа эта не бесплатна, но есть
возможность скачать пробную (trial) версию с ограниченным сроком
использования на сайте компании. Однако мы знаем, что не все так
просто. Рассмотрим коротко ее основные возможности и кратко опишем
принцип создания DjVu-документов.
В Document Express Editor, можно
открывать и конвертировать файлы таких форматов: DjVu (*.djvu, *.djv),
BMP (*.bmp), GIF (*.gif), JPEG (*.jpeg, *.jpg), PNM (*.pnm, *.ppm,
*.pgm, *.pbm), TIFF (*.tiff, *.tif), PICT (*.pict).
Для создания
DjVu-файла нужно отсканировать страницу (меню “File” ->
“Scan Pages”), либо открыть уже готовое изображение
поддерживаемого формата (меню “File” ->
“Open”). Если в документ должен быть многостраничный, то
при помощи меню “Edit” > “Insert Pages(s)
Before” или “Edit” > “Insert Pages(s)
After” вставить в документ до или после открытого изображения
остальные изображения.
Затем при помощи меню “File” -> “Save As” сохранить документ в формате DjVu.
При
сохранении файла программа предложит выбрать настройки: распознавать ли
текст; профиль; разрешение (от 100 до 600 dpi); качество текста
(возможны 5 уровней от «агрессивного», т.е. со значительной
потерей до «без потери»), сохранять изображения каждое в
отдельном или все в одном файле.
Так называемый профиль – это
тоже настройки, только пользователь выбирает тип документа, а программа
автоматически подстраивается под тип изображения.
Доступны 7 профилей:
1. «Нормальный» – для большинства отсканированных печатных документов
2. «Электронный» – для растровых изображений электронного происхождения, таких, как скриншоты и т.п.
3.
«Фото» - для фотографий. При этом функция OCR не работает,
поэтому функция поиска и копирования текста в созданном документе не
будет работать.
4. «Битональный» - для черно-белых изображений
5. «Рукопись» - для старых или рукописных изданий без рисунков или фотографий
6. «Рисунок» - похож на «Рукопись», но с поддержкой рисунков и фотографий
7. «Карта» - похож на «Рисунок», но с лучшей поддержкой перевернутого текста
Этими
настройками, как правило, действительно можно добиться
удовлетворительного результата. После того, как настройки заданы, нужно
выбрать место на локальном диске и сохранить файл в формате DjVu.
После
сохранения добавляется возможность подсвечивать области в документе,
вставлять внутренние (для самого документа) и внешние гиперссылки и
т.п. Так же если при создании DjVu-документа не было задано
распознавание текста, это можно сделать позже. Document Express Editor
6.0.1 умеет распознавать около 100 языков, в том числе русский и
украинский.
Вообще вопрос о необходимости добавления текстового
OCR-слоя при создании DjVu-документа является дискуссионным. Помимо
того, что процедура распознавания текста занимает значительное время,
OCR-слой увеличивает размер DjVu-файла. Однако наличие текстового слоя
очень удобно при дальнейшей работе с электронной книгой. Во-первых,
появляется возможность копировать нужные фрагменты текста для
последующей обработки; во-вторых – искать по ключевому слову или
выражению в самом DjVu-документе и среди всего множества
DjVu-документов как на локальных дисках, так и в сети. Функция поиска
по ключевому слову присутствует практически во всех DjVu-программах.
Для поиска в Интернет нужно использовать специальные программные
средства, например, Google Desktop Search + DjVu Indexer Plugin или
LizardTech DjVu IFilter 1.1.
Так как многие DjVu-документы содержат
текстовый OCR-слой, у некоторых пользователей создается впечатление,
что их можно конвертировать в формат DOC, или подобный. Однако формат
DjVu – это графический, а не текстовый формат. Поэтому напрямую
конвертировать DjVu-документ в формат "Word-processor" –
подобного редактора нельзя. DjVu-файл может лишь содержать встроенный
OCR-слой – простой текст без какого-либо форматирования.
Используя буфер обмена этот текстовый слой можно перенести в текстовый
редактор и вручную форматировать.
ОС: All Windows
Интерфейс: русский
Языки распознования: русский, английский
Размер: 11,65 Мб
Скачать с Letitbit Скачать с Depositfiles