Оцифровка печатных текстов: различия между версиями

Содержимое удалено Содержимое добавлено
Строка 207:
* Размер файла больше 10 КБ на страницу (кроме PDF файлов, содержащих большое число цветных фотографий). Можно пытаться оптимизировать PDF утилитами Multivalent или Acrobat. Иногда целесообразно перевести в DJVU с сохранением текста (утилита pdftodjvu).
* Неверная навигация или неверный порядок страниц. Исправляется вручную с помощью Acrobat, или Foxit PDF Editor.
* Водяные знаки, не относящиеся к тексту, или другие нежелательные пометки на страницах. Исправляется вручную редактированием PDF-файла после декомпрессии. Или с помощью Acrobat 5.0 (в Acrobat 7.0 почему-то не работает) инструментом TouchUp Object Tool в виде стрелочки-указателя (hotkey: Shift-T). Щелкаем по нежелательному объекту и удаляем.
* Большое количество растровых вставок в векторный текст (формулы, таблицы, ненадежно распознанные слова). Исправляется переводом в DJVU с сохранением текста (утилита pdftodjvu).