Nordek, это всё верно. Пральна. Согласен.
Только яж грю, у меня другое. то что 90% рунета сидят на клонах расширения Adblock и его формате правил тоже знаю. Я с Оперы слез и искал её аналог urlfiltr, нашел даже лучше.
Если коротко, то это все тоже не грузится, потому как правил хоть и не много, но они есть ~9.6KB сейчас. Я не маньячу, режу только самую вырвиглазную рекламу, баннеры со звуком вырываюцца с корнем.
Цитата Nordek:
например: с *de.adhigh.net "подтянется" один файл, при помощи которого загрузятся другие данные но уже с ads.kiosked.com, adv.mamba.ru и т.д. »
|
в том-то и дело. первый может и подтянется, но остальные нет. расширение сидит очень низко и фильтрует вообще все обращения к сети бравзера. Только что base64 не расшифровывает
Цитата Nordek:
Например сайты иметь название tovarro.com, worldssl.net, oconner.biz, datamind.ru и т.д, а название в контенте иметь вид "66f6e3f37d213970737". Причём допустимо то, что название изменится т.е при обновлении страницы уже окажется не "66f6e3f37d213970737", а "b15g4h84545hg3f32f1f". »
|
Тоже знаю, но у этих cdn тоже есть урл по которому будет грузиться, а в нем параметры всякие(одинаковые) - вот их-то я и поймаю по REGEX:
Код:

\/x?gemius(\/|\.js)
\?adsdata\W
\?zoneid=\d
# одно время, когда учил эти регулярки заделал правило кот-е ловит в сцылке разрешение экрана
# доделал и отключил
#&\w+=\d{4}&\w+=\d{4}&\w+=\d{2}&
... и стоп загрузка по этой ссылке.
Цитата:
Есть сайты, скрипты, в имени которых присутствуют "ad" "adv" "ads" - причём при таком условии, к рекламе ни какого отношения не имеют.
|
для этого в фильтрах и стоит \W - не буквенно-цифровой. т.е.
downloads или
advanced не попадают, но ежли у них вначале и в конце идет
не буква-цифра(часто это точка, '=' , или нижнее подчеркивание в передаваемых параметрах url) - режем.
+ файл исключений есть и просто внес туда:
Код:

^http:\/\/www\.oszone\.net\/
и сё. REGEX моща, хоть и мутная, но моща
