![]() |
Парсер html файла
Всем привет! Передо мной стоит следующая задача - имея ссылку на страничку в интернете проанализировать ее содержимое, скачать и сконвертировать в другой формат одну картинку (имя каждый раз разное, но есть характерные приметы), а так же скачать трейлер с ютуба. Картинку и клип положить в созданную папку. Исходная ссылка всегда имеет вид: http://www.luxorfilm.ru/film/хххх/названиефильма/ Где хххх - четыре цифры. Именно их нужно использовать в качестве имени для папки.
1 скрипт принимает ссылку как аргумент и создает папку из части этой ссылки. Каждый раз ссылка содержит четыре цифры, их и нужно взять в качестве имени 2 скачивает html файл по ссылке 3 читает содержимое файла и запишет в переменные без html тегов две ссылки: - одна на картинку - одна на ролик на ютубе 4 получает ссылку из переменной и конвертирует каринку в нужный формат 5 получает ссылку из переменной и скачивает видео с ютуба 6 складывает результаты шагов 4 и 5 в папку, созданную на шаге 1 Пока не получилось выдернуть необходимые куски текста из ссылки для скачивания картинки и ролика. Что получилось: 0 создать директорию 1 скачать файл, получить из него части текста содержащие нужные значения 2 сконвертировать файл в нужный формат 3 скачать клип с ютуба Основной скрипт: Код:
пример запуска: имяскрипта.ps1 http://www.luxorfilm.ru/film/2161/Rio-2/ Код:
$source = "http://www.luxorfilm.ru/upload/movies/2161/1000_rio2.jpg" Код:
пример запуска: |
Код:
param($url,$folder = "C:\Test") |
Время: 18:15. |
Время: 18:15.
© OSzone.net 2001-