Создание электронных книг из сканов. DjVu или Pdf из бумажной книги легко и быстро

Создание электронных книг из сканов. DjVu или Pdf из бумажной книги легко и быстро

Авторы:

Жанр: Разная литература

Циклы: не входит в цикл

Формат: Полный

Всего в книге 11 страниц. Год издания книги - 2009.

В книге рассказывается история главного героя, который сталкивается с различными проблемами и препятствиями на протяжении всего своего путешествия. По пути он встречает множество второстепенных персонажей, которые играют важные роли в истории. Благодаря опыту главного героя книга исследует такие темы, как любовь, потеря, надежда и стойкость. По мере того, как главный герой преодолевает свои трудности, он усваивает ценные уроки жизни и растет как личность. Книга завершается финалом, связывающим воедино темы и сюжетные линии, исследуемые на протяжении всей истории. В целом, книга представляет собой увлекательное и наводящее на размышления чтение, которое исследует человеческий опыт уникальным и осмысленным образом.

Читать онлайн Создание электронных книг из сканов. DjVu или Pdf из бумажной книги легко и быстро


Предисловие аффтара

Итак: перед вами взятая у приятеля, из библиотеки, или просто хорошая, интересная книга, которую хотелось бы иметь на компьютере. И не просто иметь, а иметь в таком виде, который позволил бы выполнять поиск по тексту, удобно читать книгу на экране монитора или на устройствах еВоок, а если это не научно-техническая или справочная литература — еще и читать на любимом сотовом телефоне, iPhon'e или PDA. В этом пошаговом руководстве, основанном на собственном опыте, я постараюсь рассказать о том, как «выжать» максимум результатов из проделанной простой, но иногда весьма утомительной работы по сканированию книги.

Пусть вас не испугает длина этого руководства и кажущаяся сложность сканирования и обработки книги. Процесс действительно довольно сложен и многоступенчат, но поверьте мне, описать все эти операции было гораздо труднее, чем выполнить их шаг за шагом.

Итак, ПОЕХАЛИ!

Шаг 1. Сканирование

1.1 Подготовка к процессу

Сканирование, с которого начинается, зачастую, долгий путь «в Сеть» любой изданной когда-либо книги (рынок легальных электронных книг, размещаемых издателями непосредственно после электронной верстки, у нас совершенно неразвит) — это самая монотонная часть всей предстоящей работы, поэтому к ней стоит тщательно подготовиться заранее — протереть стекло сканера, проверить наличие свободного места на диске — несжатый скан одной средней по размеру книги может занимать до 1 Гбайт. Потом начинается собственно сканирование.

Я намеренно не привожу здесь сравнительных характеристик разных моделей сканеров, поскольку каждый из нас в подавляющем большинстве случаев располагает только одним сканером, характеристики которого более или менее хорошо известны.


Phistek OpticBook: преимущества и недостатки



Из всех сканеров, имеющихся на рынке, для сканирования книг в больших количествах нет ничего лучше серии Plustek OpticBook. Эти планшетные сканеры отличаются высоким корпусом и прозрачным основанием, выполненным "в край" — так, чтобы на него можно было уложить книгу, не ломая и не деформируя корешок. Такой сканер — идеален для перевода в электронный вид десятков томов, например из библиотеки университетской кафедры. Однако, для домашнего повседневного применения он практически непригоден. Причина этого — в сугубой спецbализированности устройства под книгосканирование и OCR. В конструкции PlusTek OpticBook в жертву быстродействию и разрешению принесено все, что только можно, включая четкость, избирательность и цветопередачу.


Сканирование всех своих книг я проводил и провожу на достаточно старом (2003 года выпуска) полупрофессиональном планшетном сканере для документсистем Hewlett-Packard ScanJet 6390с. Эта машина отличается высоким быстродействием (15–25 сек на страницу формата А4 в режиме градаций серого). Кроме того, в ее комплект поставки входит удобное программное обеспечение HP Precision Scan Pro. Именно на этой программе сделаны все скрины с примерами сканирования.

1.2 Сканирование

Заранее хочу предостеречь от использования в качестве основного инструмента сканирования программы FineReader. Оставим эту программу до стадии OCR. Пока она может лишь максимально усложнить нам задачу пакетной обработки, применив (причем, без нашего ведома) — свои не слишком хорошие алгоритмы чистки и сжатия сканов. А главное — она практически лишит нас шансов применить важнейший прием — оверсемплинг до разрешения 600 dpi.

Собственно сканирование состоит из трех этапов: сканирования обложки, основной части книги, цветных вклеек и иллюстрации. Последовательно описывать эти этапы нет смысла — они переплетаются друг с другом в зависимости от верстки книги. Стоит привести лишь параметры сканирования, оптимальные для разных типов книжных страниц.

Здесь приведу еще одно важнейшее предупреждение(!):

На некоторых очень старых моделях сканеров есть возможность вручную включать внутренний оверсемплинг, тo есть фактически сканировать с меньшим разрешением, чем имеет выходной файл. Обозначается такая установка разрешения обычно словом Software или Resampled. Эту установку использовать нельзя! Ее включение приведет в полную негодность полученные файлы, и их дальнейшая обработка окончательно потеряет смысл. Также нельзя использовать установку сканирования в режиме Linearеt или Black&White (одноцветный)


Общие рекомендации такие: для текстовых страниц используйте:

• Режим Grayscale (оттенки серого), для цветных иллюстраций и обложек — True Color (полноцветный).

• Разрешение сканирования — 300 dpi (только оптическое, повторимся еще раз!).

• Остальные установки можно оставить по умолчанию.


Таблица 1. Оптимальные параметры сканирования

Эти параметры не являются догмой. Они определены опытным путем на нескольких моделях неспециализированных сканеров, и служат ориентировочным целям. Собственный набор оптимальных параметров книгосканирования всегда стоит определить экспериментально, отсканировав любимую книгу со всеми иллюстрациями и обложкой. Приводя эти параметры, я стремился обобщить их для применения на максимальном количестве моделей сканеров.


Тип страницы: Страница с черно-белым текстом без иллюстраций


С этой книгой читают
Код любви

Современный мистический женский роман, повествующий о любви американской писательницы и Мастера вампиров. Поклонников мистической литературы ждет динамичный сюжет, бурное развитие событий, атмосфера тайны и красивой любовной истории.


Человек, который любил Джейн Остин

Жизнь Элизы Найт круто меняется, когда за зеркалом старинного туалетного столика она находит два пожелтевших от времени любовных письма. Одно из них написано героем знаменитого романа к создавшей его писательнице. А второе, запечатанное красным воском, адресовано этому герою, и написала его та самая писательница! Жизнь иногда бывает удивительнее любой фантазии, но неужели герой знаменитого романа «Гордость и предубеждение» был реальным человеком?


Тайны Берлина
Жанр: История

Берлин был основан в начале XIII века на месте разрозненных славянских поселений. Его дальнейшая история на протяжении веков во многом похожа на судьбы других крупных городов Европы и в то же время она уникальна и вместе с тем трагична. Много тайн хранят дома, улицы, площади, мосты, сады и парки Берлина. Часто эти тайны связаны с выдающимися людьми и событиями, определившими ход мировой истории. О некоторых из них рассказывает книга М.Н. Кубеева.


В сетях обмана

Когда Элис Годвин было пятнадцать лет, мать серьезно заболела, и все заботы по дому легли на ее плечи. Стелла, старшая сестра, к тому времени увлеклась сочинительством. Вскоре она победила в литературном конкурсе, по условиям которого стипендиат должен был переехать в Окленд и работать там над завершением книги. Тогда он получал стипендию и контракт на издание своего произведения. Стелла категорически отказалась ехать. И чтобы не потерять предоставляемые льготы, уговорила Элис поехать и выдать себя за Стеллу Годвин.Но маленькая ложь неизменно влечет за собой большую…