Оцифровка печатных текстов: различия между версиями

м
Правки 94.181.75.177 (обсуждение) откачены к версии 212.5.69.7
м (Правки 94.181.75.177 (обсуждение) откачены к версии 212.5.69.7)
PS-файлы почти всегда являются продуктом вёрстки в системе LaTeX и могут быть автоматически сконвертированы в формат PDF с помощью бесплатного пакета ghostscript (утилита ps2pdf). Однако при этом иногда появляется проблема, состоящая в том, что полученные PDF файлы не позволяют делать поиск по тексту. Причина этого явления такова. Файлы, созданные ранними версиями LaTeX, часто имеют растровые шрифты (вместо векторных). В таком случае при переводе в PDF текст набран нестандартным (т.е. не векторным) шрифтом и поиск по файлу невозможен. При использовании достаточно новых версий LaTeX можно указать, что шрифты должны быть векторные, и эта проблема автоматически отпадает. Однако существует много PS и PDF-файлов, сделанных по-старому и проявляющих этот дефект.
 
Гавно :-))))))))Гавно...ХУЙИсправитьИсправить этот дефект можно двумя способами:
 
* Перевести файл в формат DJVU и произвести распознавание (OCR) текста. Перевод из векторного PDF в DJVU производится утилитами gs2djvu или pdftodjvu.