![]() |
Качалка сайтов
Привет!
Момогите! Мне нужна простая в применении и свою очередь эффективная качалка сайтов! Кто что может подсказать буду благодарен! Заранее спасибо! |
Teleport Pro
|
|
Offline Explorer на сегодняшний день лучшее из того, что я встречал.
Среди возможностей программы: 1. управление уровнями закачки сайта - весь сайт; текущий домен; текущая директория; N уровней на любых сайтах с заданной страницы + возможность задать фильтры по ключевым словам 2. управление расширениями закачиваемых файлов, возможность задать размер файлов которые нужно загружать 3. бан-лист на директории сайта при закачке всего сайта 4. поддержка закачки форумов и прочих скриптовых страниц 5. конвертирование ссылок 6. возможность создания настрроечных шаблонов 7. sheduling - стартование и остановка закачивания в опр. время, собственный диалер 8. просмотр страниц в саой проге как в браузере |
mrcnn
У оффлайногвого эксплорера есть один недостаток: у него нет централизованной базы данных, как у телепорта. Например, если есть слабенькитй комп с маленьким винтом и качается большрой сайт, то ОЭпро неприменим, потому что если ты перенесёшь сохранёное в каталогах, то он будет всё качать заново. А в телепорте единая база данных проекта и он лишнего качать не будет... Вердикт - Телепорт ультра и оффлайн эксплорер вместе решат почти все проблемы... в некоторых случаях потребуется ещё свой парсер + Регет Делюкс - первое - чтобы извлекать то что нужно под себя(нкто не умеет , найдя в вебстранице что-то типа http://www.somesite.com/1/username/qwerty_thumb.jpg превратить его в http://www.somesite.com/1/2/qwerty.jpg, а переименовать в то , что находится рядом со ссылкой и имеет метку nickname). а второе чтобюы качать генерённое своим парсером. Но это уже надо уметь программить на чём угодно, хоть на джаваскрипте. |
Alex Cop
Не будет он качать _все_ заново, если грамотно делать. Недавно понадобилось мне закачать заново сайт, причем закачать только новые файлы (перекачивать 400 МБ заново неохота). Старый закачанный сайт лежал в архиве, я разархивировал, начал закачку и закачал только вновь появившиеся файлы. Насколько я понимаю, он просматривает уже существующий каталог с файлами и если там уже есть, закачивать не будет. |
mrcnn Teleport Pro, вроде имеет режим обновления контента, т.е. качает только измененные файлы.
|
mrcnn
В том то и дело, что для того чтобы он правильно всё качал нужно полное развёрнутое зеркало на харде даного сайта. а если сайт занимает 10 Гб, а места только 2 Гб? а если 800 Гб? |
Alex Cop
Цитата:
Цитата:
Предубеждение у меня с 2001 г. к телепорту про после того как я с его помощью когда-то давно не смог закачать форум и мне пришлось искать другие программы, которые способны с такой задачей справится. Такой программой стала Webcopier, но это глючная качалка сайтов, и я стал использовать Offline Explorer. Аналогичное предубеждение у меня к такой программе как флэшгет. А если есть предубеждение, я вряд ли буду использовать несмотря на то, сколько изменений внесли авторы. |
mrcnn
Гм, интересная идея! Скрипт методами самого Оффлайн эксплорера, или самому писать на чём-то(для меня не проблема)? только вот пустой файл всё равно занимает размер кластера, так что тысяча файлов = 32 мегабайта, а 100 000 файлов - 3.2гБ - , НА ГРАНИ ТЕРПИМОСТИ... но зато если завинрарить, то будет мало.... хоть этот способ хорош, но всё1 равно как-то несколько... через ж... э, то есть чесать левое ухо правой рукой. но , впрочем, тоже вариант... привести пример такого сайта? например сайт с кучей фильмов и музыки, и цифры что я назыал - не предел. знаю сайт, где 3 Тб. а траффик у меня в пике 100 Мбит на внутренние сайты... так что .... |
Alex Cop
Цитата:
Фильмы и музыку качаю пофайлово. Не использую для такой задачи Offline Explorer. |
а я пошёл дальше: сейчас пишу программу ,которая парсит файлы, которые качает Оффлайн Эксплорер, заодно занимается всеми вопросами хранения всех урлов в своей базе данных, а на выходе по запросу генерирует список для закачки для Reget Deluxe. свой парсер - лучше всего. недостаток - много времени надо, чтобы её отлаживать, ну а так - универсальное решение.
|
Цитата:
|
Время: 11:20. |
Время: 11:20.
© OSzone.net 2001-