Имя пользователя:
Пароль:  
Помощь | Регистрация | Забыли пароль?  | Правила  

Компьютерный форум OSzone.net » Сфера Microsoft » Программное обеспечение Windows » SiteDownloaders

Ответить
Настройки темы
SiteDownloaders

Новый участник


Сообщения: 17
Благодарности: 0

Профиль | Отправить PM | Цитировать


Выкачиваю я, допустим, сайтик. Есть там пара десятков обьёмных файлов, которые предварительно выкачаны вручную. Есть ли какая-то TeleportPro-подобная софтина с возможностью добавления в проект таких вот своих файлов (с указанием их полного пути, естественно, чтоб оно не пыталось их перекачивать..) ?
Заранее весьма благодарен!

Отправлено: 04:35, 08-01-2005

 

(*.*)


Сообщения: 36544
Благодарности: 6691

Профиль | Сайт | Отправить PM | Цитировать


wget. Он просто пропустит эти файлы, если они конечно не были изменены на сервер с момента закачки. Достоинства обсуждались неоднократно
http://forum.oszone.net/showthread.p...highlight=wget
http://forum.oszone.net/showthread.p...highlight=wget
http://forum.oszone.net/showthread.p...highlight=wget
http://forum.oszone.net/showthread.p...highlight=wget

-------
Канал Windows 11, etc | Чат @winsiders


Отправлено: 06:37, 08-01-2005 | #2



Для отключения данного рекламного блока вам необходимо зарегистрироваться или войти с учетной записью социальной сети.

Если же вы забыли свой пароль на форуме, то воспользуйтесь данной ссылкой для восстановления пароля.


Ветеран


Сообщения: 1404
Благодарности: 135

Профиль | Отправить PM | Цитировать


Есть еще возможность установить фильтры на закачанные файлы... И мне кажется, что если просто скопировать файлы в директорию в которую скачивается сайт, то загрузчик сайтов их грузить не будет.. Обе возможности поддерживает Offline Explorer, который я юзаю.

-------
Ehhh.. what's up, doc?..


Отправлено: 08:11, 08-01-2005 | #3


Новый участник


Сообщения: 17
Благодарности: 0

Профиль | Отправить PM | Цитировать


wget - это хорошо, но.. если на сайте используют в качестве ссылок абсолютные пути (типа www.herznasho.ru/arhiv.zip или /arhiv.zip) ? Может ли он локализовать такие ссылки? Вручную не предлагать.
фильтры.. а если файлы обновятся, как я об этом узнаю?

Отправлено: 09:19, 08-01-2005 | #4


(*.*)


Сообщения: 36544
Благодарности: 6691

Профиль | Сайт | Отправить PM | Цитировать


AlexKS02
Цитата:
но.. если на сайте используют в качестве ссылок абсолютные пути (типа www.herznasho.ru/arhiv.zip или /arhiv.zip) ? Может ли он локализовать такие ссылки?
Можно
Цитата:
k --convert-links
After the download is complete, convert the links in the document to make them suitable for local viewing. This affects not only the visible hyperlinks, but any part of the document that links to external content, such as embedded images, links to style sheets, hyperlinks to non-HTML content, etc. Each link will be changed in one of the two ways:
· The links to files that have been downloaded by Wget will be changed to refer to the file they point to as a relative link. Example: if the downloaded file /foo/doc.html links to /bar/img.gif, also downloaded, then the link in doc.html will be modified to point to ../bar/img.gif. This kind of transformation works reliably for arbitrary combinations of directories.
· The links to files that have not been downloaded by Wget will be changed to include host name and absolute path of the location they point to.
Example: if the downloaded file /foo/doc.html links to /bar/img.gif (or to ../bar/img.gif), then the link in doc.html will be modified to point to http://hostname/bar/img.gif.

-------
Канал Windows 11, etc | Чат @winsiders


Отправлено: 10:18, 08-01-2005 | #5


Ветеран


Сообщения: 1404
Благодарности: 135

Профиль | Отправить PM | Цитировать


Цитата:
если файлы обновятся, как я об этом узнаю?
В offline explorer можно выбрать 3 варианта загрузки сайта:
-- все файлы
-- модифицированные или новые файлы
-- все файлы которые еще не закачаны

Прога при выборе 2 варианта сама выяснит есть ли новые файлы и если есть, то закачает..

Отправлено: 10:59, 08-01-2005 | #6


Новый участник


Сообщения: 17
Благодарности: 0

Профиль | Отправить PM | Цитировать


2 Vadikan
Благодарствую! Именно то, что мне нужно. Плохо я, значит, маны читаю )

2 mrcnn
Тоже спасибо, скачаю на досуге - посмотрю.

Похоже, что подобные темы не раз поднимались.. А с моим интырнетом сильно много не почитаешь.... Но в другой раз буду пытаться получше )))

Отправлено: 09:28, 09-01-2005 | #7


Новый участник


Сообщения: 17
Благодарности: 0

Профиль | Отправить PM | Цитировать


вопрос №2; касаемо wget'a
всё в нём хорошо, но мультипоточности не хватает.. если на сайте 10.000 страниц по 10кб, а качать надо с модема, то согласитесь, в 10 потоков скачается быстрее, чем с 1. тем более, что сайт тормозной и на реквесты страниц идёт времени больше, чем на конкретную закачку.
вопрос относится и к никсовым, и к виндовым версиям

----edited
2Vadikan
ещё один сайт тяну..
wget -t 25 -w 10 --waitretry=10 -T 20 -k -r -l inf -nc http://www.ixbt.com
o.. и любуюсь ссылками типа file:///news/index.html
Ну и к полному счастью вообще не локализовались ссылки т.н. "шапки":
>> Коротко | Процессоры | Системные платы, память и чипсеты | блаблабла
что до ужаса неудобно.
Подскажите, что с этим делать?

Последний раз редактировалось AlexKS02, 17-01-2005 в 06:00.


Отправлено: 05:33, 17-01-2005 | #8


(*.*)


Сообщения: 36544
Благодарности: 6691

Профиль | Сайт | Отправить PM | Цитировать


AlexKS02
Цитата:
o.. и любуюсь ссылками типа file:///news/index.htm
Ну насколько я вижу их robots.txt, news запрещены. Надо игнорировать robots.txt тогда полностью... В справке целая страница об этом ;-)
Код: Выделить весь код
wget -e robots=off url....
Это не очень этично делать, вообще-то. Поиграйте с таймаутами, чтобы это выглядело как запросы человека, а не спайдера (--random-wait).

Хм, большой сайт вы качаете на модемном соединении. Удачи

Добавлено: насчет мультипоточности верно подмечено. По кр. мере я не знаю как это сделать с wget.

-------
Канал Windows 11, etc | Чат @winsiders


Отправлено: 08:56, 17-01-2005 | #9


Новый участник


Сообщения: 17
Благодарности: 0

Профиль | Отправить PM | Цитировать


ещё раз благодарю! вроде как даже работает.. )
а справки в силу природной лени я досконально изучаю только к тем приложениям, где есть критическая необходимость.. proftpd с апачем например

дада, насчёт модемного соединения. не было бы у меня каждые 18мин35сек реконнектов - не мучался б с теми таймаутами.. хвала УкрНет! :\
Большой.. насколько примерно? если больше полгига, то ну его нафик...

Отправлено: 09:48, 17-01-2005 | #10



Компьютерный форум OSzone.net » Сфера Microsoft » Программное обеспечение Windows » SiteDownloaders

Участник сейчас на форуме Участник сейчас на форуме Участник вне форума Участник вне форума Автор темы Автор темы Шапка темы Сообщение прикреплено




 
Переход