Имя пользователя:
Пароль:  
Помощь | Регистрация | Забыли пароль?  | Правила  

Компьютерный форум OSzone.net » Программирование, базы данных и автоматизация действий » Скриптовые языки администрирования Windows » CMD/BAT - [решено] Разобрать большой PDF-файл на отдельные статьи по списку страниц

Ответить
Настройки темы
CMD/BAT - [решено] Разобрать большой PDF-файл на отдельные статьи по списку страниц

Новый участник


Сообщения: 44
Благодарности: 7

Профиль | Отправить PM | Цитировать


Изменения
Автор: Luzuk
Дата: 12-09-2013
Всем доброго времени суток!

Мне нужно разбить pdf файл на несколько кусков. Это нужно будет делать не однократно, поэтому задачу нужна автоматизировать.
Есть очень удобная программа pdftk, она может работать из консоли и с ее помощью можно делать множество разных операций с pdf файлами.

У меня есть 2 файла в pdf: большой текст, состоящий из отдельных статей и его содержание.
Содержание выглядит следующим образом:
Цитата:
СОДЕРЖАНИЕ
РУБРИКА 1
8 Д.В. Агеев Методы снижения вредного воздействия автомобильного транспорта на окружающую среду
10 А.В. Безымянных Разработка web-представительства для компании ОАО «Ель»
13 Р.И. Белогуб Основы теплового расчета камер испарения гигроскопических опреснителей
15 А.С. Богатырев Разработка интерфейса для программы «распределение товара по филиалам» в
системе «1С:Предприятие 8.2»
РУБРИКА 2
17 Е.Г. Болдескул Сравнительный анализ сред имитационного моделирования для описания
экономических процессов
19 В.О. Брагинец Разработка алгоритма работы программы временной передачи доступа к учётным
записям в интернет
22 А.Ю. Бурцев Анализ качества при разработке программного продукта
и т.д.
Из этого файла нужно выдернуть страницы статей и сделать из них текст: текущая страница-следующая страница. Т.е.: 8-10 10-13 13-15 17-19 19-22 22-end

Затем этот текст нужно вставить в атрибуты команды pdftk, в виде:
Код: Выделить весь код
pdftk text.pdf cat 8-10 output 8-10.pdf
pdftk text.pdf cat 10-13 output 10-13.pdf
pdftk text.pdf cat 13-15 output 13-15.pdf
В результате из единого файла со сборником статей получим, набор отдельных файлов с этими статьями.

Можно ли это сделать в винде стандартными консольными командами? Или не мучиться и на С (php) написать скрипт, который все это будет делать?

PS.
После, мне еще список нужно будет преобразовать в html и в нем сделать ссылки на эти файлы, но это уже другая задача.

Отправлено: 08:45, 12-09-2013

 

Новый участник


Сообщения: 44
Благодарности: 7

Профиль | Отправить PM | Цитировать


В виндовой консоли, как я понял, это проблемотично сделать, т.к. без регулярных выражений здесь не обойтись.

Сделал все на PHP

Отправлено: 10:58, 15-09-2013 | #2



Для отключения данного рекламного блока вам необходимо зарегистрироваться или войти с учетной записью социальной сети.

Если же вы забыли свой пароль на форуме, то воспользуйтесь данной ссылкой для восстановления пароля.


Ветеран


Сообщения: 27449
Благодарности: 8087

Профиль | Отправить PM | Цитировать


Цитата Luzuk:
В виндовой консоли, как я понял, это проблемотично сделать, т.к. без регулярных выражений здесь не обойтись. »
Не проблематично: Windows PowerShell. Это тоже «консоль».

Отправлено: 16:42, 15-09-2013 | #3



Компьютерный форум OSzone.net » Программирование, базы данных и автоматизация действий » Скриптовые языки администрирования Windows » CMD/BAT - [решено] Разобрать большой PDF-файл на отдельные статьи по списку страниц

Участник сейчас на форуме Участник сейчас на форуме Участник вне форума Участник вне форума Автор темы Автор темы Шапка темы Сообщение прикреплено

Похожие темы
Название темы Автор Информация о форуме Ответов Последнее сообщение
CMD/BAT - Как разбить текстовый файл на куски определенного размера? helik Скриптовые языки администрирования Windows 7 16-11-2011 06:35
Как порезать на куски видео wmv, flv, mp4? Dinozaur Видео и аудио: обработка и кодирование 2 11-12-2009 11:02
HDD - Куски другого видео файла на записанном DVD tonnyja Программное обеспечение Windows 9 22-10-2009 03:37
Установка - Разбивка файла .gho на куски Pavelnt Microsoft Windows 2000/XP 2 15-05-2009 12:15
Как разобрать матрешку на звук и видео ? mitiya Видео и аудио: обработка и кодирование 5 14-08-2006 04:09




 
Переход