Имя пользователя:
Пароль:  
Помощь | Регистрация | Забыли пароль?  | Правила  

Компьютерный форум OSzone.net » Программирование, базы данных и автоматизация действий » Скриптовые языки администрирования Windows » CMD/BAT - [решено] получение PDF файлов с сайта

Ответить
Настройки темы
CMD/BAT - [решено] получение PDF файлов с сайта

Пользователь


Сообщения: 52
Благодарности: 0

Профиль | Отправить PM | Цитировать


Есть txt файл, в котором записаны в каждой строке 10-значные номера:
1111111111
2222222222
3333333333
................

Необходимо читая этот файл построчно, подставлять каждую строку в запрос (см. ниже) вместо xxxxxxxx.
Но при этом в файле необходимо прописывать логин-пароль для подключения.


https://site.ru/.....createPDFbyNumb...ber=xxxxxxxxxx

И результат сохранять в отдельную папку, причем название файла должно содержать название строки, по которой делался запрос.

Отправлено: 08:49, 29-06-2012

 

Пользователь


Сообщения: 52
Благодарности: 0

Профиль | Отправить PM | Цитировать


нет идей?

Отправлено: 14:45, 04-07-2012 | #2



Для отключения данного рекламного блока вам необходимо зарегистрироваться или войти с учетной записью социальной сети.

Если же вы забыли свой пароль на форуме, то воспользуйтесь данной ссылкой для восстановления пароля.


Старожил


Сообщения: 415
Благодарности: 257

Профиль | Отправить PM | Цитировать


Я правильно понимаю алгоритм?
1) Брать номера из файла
2) Посылать запрос
3) Сохранять полученный в ответ на запрос файл под именем, взятым ранее из строки
Если да, то это делается элементарно, с помощью wget и for. Не понятен только пункт про логин:пароль, где они указываются? В теле запроса, прямо в url?

Отправлено: 15:04, 04-07-2012 | #3


Пользователь


Сообщения: 52
Благодарности: 0

Профиль | Отправить PM | Цитировать


Изображения
Тип файла: jpg wget.jpg
(72.5 Kb, 7 просмотров)
Вложения
Тип файла: txt 1.txt
(1.5 Kb, 11 просмотров)

да именно так, логин-пароль указывается в url.
файл итоговый должен быть pdf.
Wget использую, но итоговый pdf файл получить не могу, сохраняет какую-то ерунду.

Во вложении скан запроса WGET.
В принципе файл сохраняется, но название его и расширение непонятные, если переименовывыю файл в 1.txt (во вложении), то он читается.

В итоге как я понимаю какая-то ошибка, и pdf не сохраняется.

Отправлено: 15:17, 04-07-2012 | #4


Старожил


Сообщения: 415
Благодарности: 257

Профиль | Отправить PM | Цитировать


В 1.txt запрос на авторизацию, точнее, страница логина. Это значит, что либо указания пары логин:пароль недостаточно, и нужно использовать ещё cookie, например - либо тем ресурсом блокируется сам wget по каким-то причинам. Попробуйте повторить запрос с добавкой ключа -U "useragent", где подставьте какой-то валидный юзерагент, к примеру, от Firefox.

Если не повезет, всегда можно попробовать использовать aria2 (очень мощная консольная качалка, для пакетного многопоточного скачивания незаменима) - сначала генерировать для неё файл с командами, а затем пакетно сохранять полученные pdf-ки.

Отправлено: 15:31, 04-07-2012 | #5


Пользователь


Сообщения: 52
Благодарности: 0

Профиль | Отправить PM | Цитировать


вообще на этом сайте сказано по ftp надо логиниться через filezilla и параметр Encryption д.б. - explicit FTP over TSL, может в этом проблема?

Отправлено: 15:38, 04-07-2012 | #6


Старожил


Сообщения: 415
Благодарности: 257

Профиль | Отправить PM | Цитировать


LAKERS824, попробуйте с помощью Aria2
Полный мануал на русском
Бинарник под Windows, x86

Отправлено: 15:45, 04-07-2012 | #7


Пользователь


Сообщения: 52
Благодарности: 0

Профиль | Отправить PM | Цитировать


спасибо, буду тогда курить Aria2, раз wget не хочет.

Отправлено: 16:12, 04-07-2012 | #8


Пользователь


Сообщения: 52
Благодарности: 0

Профиль | Отправить PM | Цитировать


нет, опять почему-то не хочет, ссылается на сертификат, правда если в браузере набивают, там вроде никакого сертификата не надо.

Отправлено: 16:32, 04-07-2012 | #9


Старожил


Сообщения: 415
Благодарности: 257

Профиль | Отправить PM | Цитировать


LAKERS824, вы недостаточно внимательно читали ман.
Код: Выделить весь код
--check-certificate=false
Если оставить проверку включенной, то нужно указывать их хранилище, что на windows реализовать с помощью aria затруднительно.
Действие этого ключа равнозначно ключу --no-check-certificate у wget.
Это сообщение посчитали полезным следующие участники:

Отправлено: 16:50, 04-07-2012 | #10



Компьютерный форум OSzone.net » Программирование, базы данных и автоматизация действий » Скриптовые языки администрирования Windows » CMD/BAT - [решено] получение PDF файлов с сайта

Участник сейчас на форуме Участник сейчас на форуме Участник вне форума Участник вне форума Автор темы Автор темы Шапка темы Сообщение прикреплено

Похожие темы
Название темы Автор Информация о форуме Ответов Последнее сообщение
C/C++ - Получение контрольных сумм файлов (MD5, и т.д.) и их проверка в Online-сервисах Drongo Программирование и базы данных 49 30-08-2010 18:39
Вопрос: Получение MCP clin Флейм 1 28-04-2010 01:32
Программное получение IP из DNS rarelang Программирование и базы данных 2 05-07-2004 10:48
Закачка файлов на компьютер посетителя сайта MrX Вебмастеру 4 05-04-2004 08:10
Получение пошты DYURIK Сетевые технологии 3 26-01-2004 16:18




 
Переход