Как распознать формат djvu?
На текущий момент существует порядка нескольких десятков форматов электронных книг. Каждый из них представляет нечто особенное, но среди них можно выделить 3 «кита», которые чаще всего используются: pdf, djvu и html. Форматы pdf и djvu чаще всего являются лишь фотографиями, т.е. сканированной версией журнала или книги. Для выделения текста таких электронных копий необходимо использовать специальное программное обеспечение, которое способно распознавать изображения и проявлять в них текстовую основу. Для чтения djvu-файлов можно воспользоваться любой программой-просмотрщиком, в качестве примера будет использована утилита DjVu Editor. Для качественного отображения только текста воспользуйтесь опцией «Черно-белый режим отображения» в настройках программы. Теперь вам необходимо произвести экспорт нужных страниц для последующего распознавания. Нажмите верхнее меню «Печать» и в открывшемся окне выберите принтер Microsoft Office Document Image Writer. С его помощью вы можете создать виртуальную книгу с нужными для вас страницами. Другими словами, вам необходимо создать многостраничный tiff-файл. В открывшемся окне перейдите к вкладке «Дополнительно», выберите соответствующий формат и дважды нажмите кнопку «ОК». Распознавание получившегося графического файла можно осуществить через стандартную утилиту Document Imaging внутри комплекта Microsoft Office. Для быстрого запуска файла необходимо нажать правой кнопкой мыши на нем в окне «Проводника Windows», выбрать раздел «Открыть с помощью» и щелкнуть мышкой по пункту Microsoft Office Document Imaging. После автоматического распознавания содержимого загруженного изображения вам необходимо скопировать нужный текст. Для этого левой кнопкой мыши выделите область нужного размера и в контекстном меню выберите пункт «Копировать». Теперь откройте MS Word и вставьте текст из буфера обмена. Вам осталось привести его к читаемому виду и начать им пользоваться.
Оцените статью!
Вам понадобится
- - DjVu Editor;
- - Microsoft Office.