Создание электронной копии книги в формате DjVu в Linux: различия между версиями

Содержимое удалено Содержимое добавлено
Отмена правки 145769, сделанной John Veniza (обсуждение) rvv
Метка: отмена
русский язык
Строка 17:
# '''Viewnior''' — просмотр и кадрирование изображений.
Дополнительные программы
* ''DjView4'' — извлечение DjVu страниц DjVu из документа, а также конвертирование документа и его отдельных страниц в другие форматы: PDF, PNG и др.
 
== Сканирование ==
Строка 32:
Последовательно сканируем страницы книги по одной или по две сразу (разворотом). Сохраняем одну ориентацию страниц при сканировании. Качество сканирования контролируем программой '''Geeqie'''. Обращаем внимание на место соединения страницы с переплётом — в нём могут образовываться затемнённые области, которые при обработке превращаются в чёрные полосы, закрывающие текст, чтобы избежать их, необходимо хорошо прижимать книгу к стеклу сканера в месте переплёта. Для начала сканирования каждой страницы используем кнопку на корпусе сканера. Изображения будут автоматически сохраняться в указанной папке. Все страницы будут иметь порядковые названия 0001.jpeg, 0002.jpeg, 0003.jpeg… — это важно, так как при конвертировании в DjVu программа-обработчик будет собирать их в книгу в той же последовательности.
; Улучшение резкости сканов
Для улучшения резкости сканов используем [[w:Нерезкое маскирование|нерезкую маску]]. Открываем терминал в папке со сканами и вводим команду-цикл, обрабатывающую все JPEG файлы JPEG
<source lang="bash">for file in *.jpeg; do convert -unsharp 0 $file $file; done</source>
Значения параметра <code>-unsharp</code> выбраны по умолчанию: radius <code>0</code>, sigma 1.0, gain 1.0, threshold 0.05.
Строка 114:
<source lang="bash">for file in *.tif; do cjb2 -dpi 600 $file ${file%tif}djvu; done</source>
<source lang="bash">djvm -c Kniga.djvu *.djvu</source>
После этого, при необходимости, в djvu-файл книги необходимоможно добавить оглавление.
 
==== С img2djvu ====
Строка 125:
<code>out</code> — название папки.
 
По умолчанию, img2djvu применяет к изображениям параметры «-contrast -blur 0x1»: -contrast увеличивает контраст, а -blur размывает полиграфический растр. Чтобы отключить это, необходимо запускать img2djvu с параметром -p "":
<source lang="bash">./img2djvu -l 1 -d 600 -p "" out</source>
 
Строка 135:
Интерактивное оглавление в электронной книге помогает быстрее производить навигацию по ней, поэтому его желательно добавлять. Однако, если оглавление достаточно объёмное, что вызовет значительные трудовые и временные затраты по его добавлению, то можно обойтись без него, добавив только одну ссылку на страницу с ним в книге. В этом случае читатель сможет перейти на нужную ему страницу, набрав вручную номер страницы в программе-просмотрщике DjVu-файлов.
 
При необходимости, предварительно, программой YAGF + Tesseract распознаём текст с обработанных в Scan Tailor страниц оглавления книги. Открываем созданный DjVu-файл книги программой '''DjVuSmooth''' и добавляем в него оглавление.
 
Для исправления структуры оглавления, при возможных ошибках визуального редактирования, используем команды:<br>
Извлечение оглавления DjVu -книги с его записью в текстовый файл:
<source lang="bash">djvused Kniga.djvu -u -e print-outline > Oglavlenie</source>
Добавление оглавления в DjVu -книгу из текстового файла:
<source lang="bash">djvused Kniga.djvu -s -e "set-outline Oglavlenie"</source>
, где <code>Oglavlenie</code> — имя текстового файла.
Строка 179:
{{Якорь|Примеры использования утилит DjVuLibre}}
 
=== Добавление, удаление, извлечение DjVu страниц DjVu ===
; Добавление
<source lang="bash">djvm -i Kniga.djvu 3.djvu 3</source>
Строка 222:
<source lang="bash">for file in *.jpg; do convert -crop 100%x99%+0+0 $file $file; done</source>
; LibTiff
Извлечение всех tif страниц из tif из документа tif:
<source lang="bash">tiffsplit Kniga.tif</source>
 
== См. также ==
* [[Редактирование PDF -файлов в Linux]]
* [[Оцифровка печатных текстов]]
* [[Мультимедиа в командной строке]]