Имя пользователя:
Пароль:  
Помощь | Регистрация | Забыли пароль?  | Правила  

Компьютерный форум OSzone.net » Компьютеры + Интернет » Хочу все знать » как распечатать pdf, djvu без картинок?

Ответить
Настройки темы
как распечатать pdf, djvu без картинок?

Старожил


Сообщения: 190
Благодарности: 0

Профиль | Сайт | Отправить PM | Цитировать


Нужно распечатать отсканеную книгу. Там очень много картинок, которые никакой смысловой нагрузки не несут (учебник по англ.языку). И в целом это часто встречаемая проблема. Казалось бы положение безвыходное, но ведь уже 21-ый век, неужели наука до сих пор ничего не придумала?

Отправлено: 10:48, 12-10-2011

 

Аватара для Morpheus

Ветеран


Сообщения: 12426
Благодарности: 2328

Профиль | Отправить PM | Цитировать


spyphy, сканировать можно по-разному.
1. Страница книги сканируется в виде одной картинки. Способ менее трудоёмкий, но уже ни текст не отредактировать, ни картинки не вырезать (как картинку вырезать из картинки и кто должен отличить картинки от текста?).
Лечится вторым способом.
2. Страница книги сканируется и распознаётся программами типа FineReader. Тогда на выходе вы получаете редактируемый текст и возможность манипулировать картинками и иными данными.

Вопрос: каким способом отсканирована книга? Есть ли в ваших pdf-ах текстовый слой (проверяется возможностью выделения)?
Это сообщение посчитали полезным следующие участники:

Отправлено: 11:42, 12-10-2011 | #2



Для отключения данного рекламного блока вам необходимо зарегистрироваться или войти с учетной записью социальной сети.

Если же вы забыли свой пароль на форуме, то воспользуйтесь данной ссылкой для восстановления пароля.


ИО Капитана Очевидности


Contributor


Сообщения: 5387
Благодарности: 1105

Профиль | Отправить PM | Цитировать


Цитата spyphy:
Нужно распечатать отсканеную книгу. Там очень много картинок, которые никакой смысловой нагрузки не несут (учебник по англ.языку) »
Там вся страница представляет собой одну картинку (набор точек разного цвета), которую для получения текста (набора символов) нужно обработать программой распознавания текста (FineReader или аналогичной)

-------
Самое совершенное оружие, которым забиты арсеналы богатых и процветающих наций, может легко уничтожить необразованного, больного, бедного и голодного. Но оно не может уничтожить невежество, болезнь, нищету и голод. (Фидель Кастро)

Почему всех осужденных за измену Родине при Сталине реабилитировали при Горбачёве по отсутствию состава преступления? Потому что при Горбачёве измену Родине перестали считать преступлением.


Отправлено: 10:16, 13-10-2011 | #3


Старожил


Сообщения: 190
Благодарности: 0

Профиль | Сайт | Отправить PM | Цитировать


Цитата El Scorpio:
Там вся страница представляет собой одну картинку »
это я в курсе.
распознавание и копирование текста - вряд ли лучший способ.
Там некоторые картинки занимают по пол страницы (с 90% заполнением). Неплохо было бы иметь ПО, каторое бы распознавало именно эти картинки и удаляла их хотя бы частично. В крайнем случае сгодился бы ручной инструмент для выделения таких картинок (но только чтобы быстро и удобно было, так как много страниц обрабатывать надо).

может под линуксом какие то утилиты существуют, способные совершать подобную обработку изображений, а там глядишь и автоматизировать можно будет?...

Еще здесь имеется вторая проблема - это когда текст на тёмном фоне. Ксерокс как-то умеет рапознавать это дело и печатает без фона. А вот можно ли так настроить принтер или акробат-ридер, чтобы он автоматически менял контрастность?...

Отправлено: 14:38, 13-10-2011 | #4


Аватара для freese

Ветеран


Contributor


Сообщения: 6683
Благодарности: 1296

Профиль | Отправить PM | Цитировать


Цитата spyphy:
В крайнем случае сгодился бы ручной инструмент для выделения таких картинок »
тот же finereader определяет картинки

Отправлено: 15:11, 13-10-2011 | #5


Ветеран


Сообщения: 3806
Благодарности: 824

Профиль | Отправить PM | Цитировать


FineReader - штука хорошая, но не панацея - после него необходимо вычитывать текст, т.к. распознаётся не всегда верно.

Отправлено: 09:49, 14-10-2011 | #6


Ветеран


Сообщения: 27449
Благодарности: 8087

Профиль | Отправить PM | Цитировать


Busla, предложения?

Отправлено: 10:17, 14-10-2011 | #7


Аватара для Morpheus

Ветеран


Сообщения: 12426
Благодарности: 2328

Профиль | Отправить PM | Цитировать


Мне вот интересно, любая тема, если она находится в ХВЗ, должна наполниться флеймом?

Отправлено: 11:14, 14-10-2011 | #8


Ветеран


Сообщения: 27449
Благодарности: 8087

Профиль | Отправить PM | Цитировать


Morpheus, где флейм? Вроде нету. Рассуждения, как можно добиться желаемого автором результата.

Отправлено: 12:34, 14-10-2011 | #9


Аватара для Morpheus

Ветеран


Сообщения: 12426
Благодарности: 2328

Профиль | Отправить PM | Цитировать


Iska, пока нету. Но и идей, кроме второй раз предложенного файнридера тоже нету. Слишком много в последнее время развелось пустых и дублирующих сообщений, которые кроме шума в эфире ничего не создают.

Отправлено: 13:59, 14-10-2011 | #10



Компьютерный форум OSzone.net » Компьютеры + Интернет » Хочу все знать » как распечатать pdf, djvu без картинок?

Участник сейчас на форуме Участник сейчас на форуме Участник вне форума Участник вне форума Автор темы Автор темы Шапка темы Сообщение прикреплено

Похожие темы
Название темы Автор Информация о форуме Ответов Последнее сообщение
[решено] Конвертер PDF в DJVU PulSar.CE194694 Хочу все знать 12 22-02-2017 19:16
[решено] Как получить только исхоный код страницы по HTTP (без картинок и тд - только текст)? evg64 AutoIt 3 10-01-2010 01:17
Помогите найти конвертер из PDF, DjVu в CHM verdix Хочу все знать 7 19-12-2008 16:13
Офис и Текст - Программы для конвертирования DJVu в PDF RuLe Программное обеспечение Windows 11 04-08-2008 12:29




 
Переход