-
Вебмастеру
(
http://forum.oszone.net/forumdisplay.php?f=22)
Собиратель ссылок типа sitemap
Господа, никто не знает алгоритма собирателя уникальных ссылок с сайта для создания карты сайта? Не хочется выдумывать велосипед, может кто-то делал.
|
Vlad Drakula |
01-09-2006 15:34 479569 |
benya
все зависит от того если доступ к движку сайта или нет.
|
Vlad Drakula,
А зачем нужен доступ? По принципу скачивания страниц целиком наверное... Зашли на страницу, собрали ссылки, выкинули дубликаты и так дальше по очереди... Но вот как...
|
Vlad Drakula |
01-09-2006 17:30 479633 |
benya
я просто генерю ракту сайта сразу в момент генерации всего сайта это проще удобнее и быстрее.
|
Ну я бы так тоже сделал, только вот не знаю как отгенерить все страницы...
|
E-mail |
01-09-2006 23:40 479749 |
интересно у нас тут есть ктонибудь с рамблера, яндекса или апорта?:)
Vlad Drakulaэто как?...
у меня при произношении этого слова странные представления в голове проявляются =)
|
Prisoner |
02-09-2006 10:25 479832 |
benya, не знаю как на счет велосипеда, но задача в общем-то довольно простая, чтобы реализовывать ее множеством невелосипедных путей:
1) Регулярным выражением примерного вида
Код:
<a.*?href=['"]?((?:(?:https?|ftp|file)://)?[-A-Z0-9+&@#/%?=~_|!:,.;]*[-A-Z0-9+&@#/%=~_|])['"]?
(с i модификатором) выдираем ссылки из текста странички. Получам массив строк, являющихся значениями атрибута href всех ссылок.
2) Применяем к массиву функцию array array_unique(array) и получаем массив с убранными повторяющимися ссылками.
По сути это все, разве что будет дополнительные моменты по разбору могущих возникнуть нюансов.
|
Prisoner, забыл экранировать опасные символы :).
|
E-mail |
03-09-2006 04:10 480094 |
ага, а еще добавить протокол http:
|
Prisoner |
03-09-2006 16:11 480175 |
Sham, E-mail, прошу прощения, ваши замечания учитываются моими "примерным" и P.S. соответственно - я не собирался давать полного ответа, это лишнее.
|
nec 3540A |
16-09-2006 15:46 485622 |
А есть ли программа для создание "карты сайта", находящегося уже в сети?
|
Prisoner |
16-09-2006 16:36 485632 |
|
Prisoner,
А как на счет относительных ссылок типа:
page.html
/page.html
../page.html
|
Prisoner |
19-09-2006 15:27 486785 |
В свете какого вопроса? Программы строящей карту или предложенного мной алгоритма?
|
Prisoner,
Вообще программы строящей карту
|
Prisoner |
19-09-2006 19:14 486886 |
Не знаю, benya, этим классом софта я не пользовался.
|
Время: 16:06.
© OSzone.net 2001-