|
Компьютерный форум OSzone.net » Программирование, базы данных и автоматизация действий » Скриптовые языки администрирования Windows » CMD/BAT - [решено] получение PDF файлов с сайта |
|
|
CMD/BAT - [решено] получение PDF файлов с сайта
|
Пользователь Сообщения: 52 |
Есть txt файл, в котором записаны в каждой строке 10-значные номера:
1111111111 2222222222 3333333333 ................ Необходимо читая этот файл построчно, подставлять каждую строку в запрос (см. ниже) вместо xxxxxxxx. Но при этом в файле необходимо прописывать логин-пароль для подключения. https://site.ru/.....createPDFbyNumb...ber=xxxxxxxxxx И результат сохранять в отдельную папку, причем название файла должно содержать название строки, по которой делался запрос. |
|
Отправлено: 08:49, 29-06-2012 |
Пользователь Сообщения: 52
|
Профиль | Отправить PM | Цитировать нет идей?
|
Отправлено: 14:45, 04-07-2012 | #2 |
Для отключения данного рекламного блока вам необходимо зарегистрироваться или войти с учетной записью социальной сети. Если же вы забыли свой пароль на форуме, то воспользуйтесь данной ссылкой для восстановления пароля. |
Старожил Сообщения: 415
|
Профиль | Отправить PM | Цитировать Я правильно понимаю алгоритм?
1) Брать номера из файла 2) Посылать запрос 3) Сохранять полученный в ответ на запрос файл под именем, взятым ранее из строки Если да, то это делается элементарно, с помощью wget и for. Не понятен только пункт про логин:пароль, где они указываются? В теле запроса, прямо в url? |
Отправлено: 15:04, 04-07-2012 | #3 |
Пользователь Сообщения: 52
|
Профиль | Отправить PM | Цитировать да именно так, логин-пароль указывается в url.
файл итоговый должен быть pdf. Wget использую, но итоговый pdf файл получить не могу, сохраняет какую-то ерунду. Во вложении скан запроса WGET. В принципе файл сохраняется, но название его и расширение непонятные, если переименовывыю файл в 1.txt (во вложении), то он читается. В итоге как я понимаю какая-то ошибка, и pdf не сохраняется. |
Отправлено: 15:17, 04-07-2012 | #4 |
Старожил Сообщения: 415
|
Профиль | Отправить PM | Цитировать В 1.txt запрос на авторизацию, точнее, страница логина. Это значит, что либо указания пары логин:пароль недостаточно, и нужно использовать ещё cookie, например - либо тем ресурсом блокируется сам wget по каким-то причинам. Попробуйте повторить запрос с добавкой ключа -U "useragent", где подставьте какой-то валидный юзерагент, к примеру, от Firefox.
Если не повезет, всегда можно попробовать использовать aria2 (очень мощная консольная качалка, для пакетного многопоточного скачивания незаменима) - сначала генерировать для неё файл с командами, а затем пакетно сохранять полученные pdf-ки. |
|
Отправлено: 15:31, 04-07-2012 | #5 |
Пользователь Сообщения: 52
|
Профиль | Отправить PM | Цитировать вообще на этом сайте сказано по ftp надо логиниться через filezilla и параметр Encryption д.б. - explicit FTP over TSL, может в этом проблема?
|
Отправлено: 15:38, 04-07-2012 | #6 |
Старожил Сообщения: 415
|
Профиль | Отправить PM | Цитировать |
Отправлено: 15:45, 04-07-2012 | #7 |
Пользователь Сообщения: 52
|
Профиль | Отправить PM | Цитировать спасибо, буду тогда курить Aria2, раз wget не хочет.
|
Отправлено: 16:12, 04-07-2012 | #8 |
Пользователь Сообщения: 52
|
Профиль | Отправить PM | Цитировать нет, опять почему-то не хочет, ссылается на сертификат, правда если в браузере набивают, там вроде никакого сертификата не надо.
|
Отправлено: 16:32, 04-07-2012 | #9 |
Старожил Сообщения: 415
|
Профиль | Отправить PM | Цитировать |
Отправлено: 16:50, 04-07-2012 | #10 |
|
![]() |
Участник сейчас на форуме |
![]() |
Участник вне форума |
![]() |
Автор темы |
![]() |
Сообщение прикреплено |
| |||||
Название темы | Автор | Информация о форуме | Ответов | Последнее сообщение | |
C/C++ - Получение контрольных сумм файлов (MD5, и т.д.) и их проверка в Online-сервисах | Drongo | Программирование и базы данных | 49 | 30-08-2010 18:39 | |
Вопрос: Получение MCP | clin | Флейм | 1 | 28-04-2010 01:32 | |
Программное получение IP из DNS | rarelang | Программирование и базы данных | 2 | 05-07-2004 10:48 | |
Закачка файлов на компьютер посетителя сайта | MrX | Вебмастеру | 4 | 05-04-2004 08:10 | |
Получение пошты | DYURIK | Сетевые технологии | 3 | 26-01-2004 16:18 |
|