HTML parser

Sham · Отправлено: **00:10, 09-05-2008** | #2

SliderVM, есть же теги [php][/php]

Цитата SliderVM:

PHP код:


while ( !preg_match('/\\r\\n\\r\\n$/', $responseHeader) );

А зачем экраны дублированы?

bruder · Отправлено: **11:51, 09-05-2008** | #3

все дело в бесконечном цикле

PHP код:


while ($read_length < $chunk_length) {
$responseContentChunk .= fread($filePointer, $chunk_length - $read_length);
$read_length = strlen($responseContentChunk);
}

там $read_length всегда 0. А я с soketами совсем незнаком. Неужели чтобы получить контент страницы надо так сложно? Прошу профи объяснить на пальцах этот метод, очень интересно

rus-4-ever · Отправлено: **13:10, 10-05-2008** | #4

Может так лучше??? по крайней мере работает!!!

Тут файл записыватся в массив построчно

Цитата:

if (!($arr=file("http://yandex.ru","r"))) {die("извините, сервис временно недоступен");}

$j=0;

do
{
//Код...

$j++;
}
while ($j<count($arr));

SliderVM · Конфигурация компьютера

yandex.ru и у меня получается скопировать... А вот к примеру "ufacars.myminicity.com" так не работает

Цель у меня распарсить именно "ufacars.myminicity.com".

Busla · Отправлено: **12:04, 11-05-2008** | #6

заголовок темы поменяй на более соответствующий содержанию - может больше толковых советов напишут

SliderVM · Конфигурация компьютера

Название темы правильное

"ufacars.myminicity.com" это только один из многих сайтов!

Busla · Отправлено: **14:23, 11-05-2008** | #8

приведённый код парсит http, а html он извлекает (иногда

)

SliderVM · Конфигурация компьютера

Ну а как сделать что бы извлечь код HTML?

Sham · Отправлено: **19:24, 11-05-2008** | #10

SliderVM, обрати внимание на мой пост и посуди - цикл заканчивается, когда получены все заголовки, т.о. контент не включается... (при условии, что регулярка корректно работает, в чем я не уверен)....