Имя пользователя:
Пароль:  
Помощь | Регистрация | Забыли пароль?  | Правила  

Компьютерный форум OSzone.net » Программирование, базы данных и автоматизация действий » Скриптовые языки администрирования Windows » CMD/BAT - [решено] Поиск в html файле ip адресов и копирование их в новый txt.

Ответить
Настройки темы
CMD/BAT - [решено] Поиск в html файле ip адресов и копирование их в новый txt.

Новый участник


Сообщения: 7
Благодарности: 0

Профиль | Отправить PM | Цитировать


Приветствую всех! Задача такая: мне на ftp приходят много сохранённых web страниц (другие пользователи в своём браузере сохраняют интернет страницу ко мне на ftp), эти страницы содержат списки ip адресов. Я не могу додуматься, как мне реализовать "вырезание" этих ip-шников в новый текстовый документ. Знаний никаких в этой области. Подробнее: имеется сохранённая html страница (со всеми картинками, стилями и скриптами), просматриваемая в оффлайн режиме, для меня важен лишь html файл, при открытии которого в блокноте, в теле, среди множества тегов и кучи ненужного мусора, имеется списочек ip адресов. Необходимо эти ip адреса перенести в текстовый документ. На странице количество ip адресов может варьироваться. В добавок перед и после ip-шников может не быть пробелов, а сразу начинается текст (всё слитно). Получается некий граббер ip списка. Конечный txt файл должен содержать список ip адресов в столбец построчно. Использование сторонних программ не представляется возможным, так как другие пользователи удалённо заходя в ftp папку будут запускать батник. Помогите реализовать данный проект, если средствами windows это возможно.

Отправлено: 12:21, 30-04-2015

 

Ветеран


Сообщения: 874
Благодарности: 575

Профиль | Отправить PM | Цитировать


666egor666, если не выложите архив с образцами сохранённых веб-страниц, никакого конкретного ответа не получите.

Отправлено: 13:30, 30-04-2015 | #2



Для отключения данного рекламного блока вам необходимо зарегистрироваться или войти с учетной записью социальной сети.

Если же вы забыли свой пароль на форуме, то воспользуйтесь данной ссылкой для восстановления пароля.


Ветеран


Сообщения: 27449
Благодарности: 8087

Профиль | Отправить PM | Цитировать


WSH, PoSH, AutoIt и т.п. плюс регулярное выражение для поиска и извлечения ip-адреса.

Отправлено: 15:30, 30-04-2015 | #3


Новый участник


Сообщения: 7
Благодарности: 0

Профиль | Отправить PM | Цитировать


Вложения
Тип файла: rar StatusRpm.rar
(5.8 Kb, 12 просмотров)

Georgio, страницы могут быть абсолютно разными, это что то вроде если открыть любую интернет страницу и не раздумывая в любое место просто вставить ip-шник. Ну для примера прикрепляю файлик html, это поле информации статуса моего роутера. Там как раз присутствуют несколько ip-шников, и они не разделены пробелами от текста и символов (в моём файле некоторые ip с двойными ковычками, но это может быть и текст)

Отправлено: 19:36, 30-04-2015 | #4


Новый участник


Сообщения: 7
Благодарности: 0

Профиль | Отправить PM | Цитировать


Возможно ли справиться с данной задачей, например, поиском по маске *.*.*.* или что то в этом роде? Эта маска характеризует любой ip, может быть как то можно искать данное сочетание?

Отправлено: 19:41, 30-04-2015 | #5


Ветеран


Сообщения: 874
Благодарности: 575

Профиль | Отправить PM | Цитировать


Код PowerShell:
Код: Выделить весь код
(gc 'StatusRpm.html') -replace '[^0-9\.]',' ' -split ' ' -match '[1-9][0-9]{0,2}(\.[0-9]{1,3}){3}'|sort -Unique|Out-File 'IP.txt'
.
Это сообщение посчитали полезным следующие участники:

Отправлено: 15:37, 01-05-2015 | #6


Ветеран


Сообщения: 27449
Благодарности: 8087

Профиль | Отправить PM | Цитировать


Georgio, токмо шаблон не нравится. Попадался мне такой:
Код: Выделить весь код
"(((1\d{2})|(2[0-4]\d)|(25[0-5])|\d{1,2})\.){3}((1\d{2})|(2[0-4]\d)|(25[0-5])|\d*​{1,2})(\-((1\d{2})|(2[0-4]\d)|(25[0-5])|\d{1,2}))?(,(((1\d{2})|(2[0-4]\d)|(25[0-5*​])|\d{1,2})\.){3}((1\d{2})|(2[0-4]\d)|(25[0-5])|\d{1,2})(\-((1\d{2})|(2[0-4]\d)|(*​25[0-5])|\d{1,2}))?)*"

Отправлено: 18:44, 01-05-2015 | #7


Ветеран


Сообщения: 874
Благодарности: 575

Профиль | Отправить PM | Цитировать


Цитата Iska:
Попадался мне такой: <...> »

Ужас!

Но главное в коде -- это верный принцип.

Кстати, и от ненужных точек (возможно, и цифр) в выводе (перед и после самого IP) код не застрахован. Надо было ещё "триммить".

Отправлено: 20:01, 01-05-2015 | #8


Ветеран


Сообщения: 27449
Благодарности: 8087

Профиль | Отправить PM | Цитировать


Цитата Georgio:
Ужас! »
Ага . Я плюнул и даже не стал разбираться детально.

В принципе работает, даже с некоторым перебором (скажем, для него в строке «556.56.56.56» будет таки найден ip-адрес «556.56.56.56» — не знаю, стоит ли считать данный выбор «искать любое, что подходит» идеологически корректным).

Отправлено: 00:07, 02-05-2015 | #9


Новый участник


Сообщения: 7
Благодарности: 0

Профиль | Отправить PM | Цитировать


Georgio, Огромное Спасибо! Скрипт на 100% выполняет задачу. Ну а запуск скрипта powershell у других пользователей не проблема ( заметка для других пользователей, интересующихся этой темой: Win+r, powershell.exe, Set-ExecutionPolicy RemoteSigned. Эти действия дают права запуска собственно созданных скриптов).

Отправлено: 13:06, 02-05-2015 | #10



Компьютерный форум OSzone.net » Программирование, базы данных и автоматизация действий » Скриптовые языки администрирования Windows » CMD/BAT - [решено] Поиск в html файле ip адресов и копирование их в новый txt.

Участник сейчас на форуме Участник сейчас на форуме Участник вне форума Участник вне форума Автор темы Автор темы Шапка темы Сообщение прикреплено

Похожие темы
Название темы Автор Информация о форуме Ответов Последнее сообщение
CMD/BAT - Поиск в html файле ip адресов и копирование их в новый txt. 666egor666 Тест-форум 0 30-04-2015 11:31
CMD/BAT - Поиск строк в файле и замена их на числа,сгенерированные по маске. galclerik Скриптовые языки администрирования Windows 17 19-12-2013 11:59
[решено] Поиск на сайтах. Как обойти ограничение в файле robots.txt adgeuk Хочу все знать 2 17-08-2012 16:34
CMD/BAT - [решено] Поиск строк с указанным словом и копирование их в отдельный файл Maartimus Скриптовые языки администрирования Windows 2 13-07-2010 20:25
[решено] Поиск файлов в подпапках и их последующее копирование D_Master AutoIt 4 10-02-2009 07:32




 
Переход