![]() |
описать логику программки
Добрый день! Подскажите пожалуйста, как описать логику программы, которая срезала бы определенную статью, например с какого-нибудь новостного портала. В итоге статья должна быть в тексте и содержать только текст самой статьи, ну и возможно дату, автора заголовок итд. А так же все это должно быть автоматизировано. Спасибо!
|
на мой взгляд можно пойти по пути наименьшего сопротивления, если у тебя скажем постоянный новостной портал и он на html (java, а вообще не суть), то можно воспользоваться его статичностью и написать программку, которая бы этот гипертекст разбирала. Скажем ты знаешь что в начале идет стандартная преамбула - <script>фигня</script> + <head>фигня</head> и ты знаешь что новость это всегда - в центральном столбце body, 3-ей горизонтальной подстроке (теги <tb><tr>) заголовок-ссылка (<а>) и затем сам текст и т.п. Ну вот тупо ищешь эти строки и все. Главное опираться на теги - они всегда одни и теже, верстальщики обычно люди грамотные и делают просто и элегантно.
можно даже себе блок-схему сайта для удобства нарисовать, чтобы четко понимать его структуру. Главное - теги |
Время: 01:01. |
Время: 01:01.
© OSzone.net 2001-