|
Компьютерный форум OSzone.net » Программирование, базы данных и автоматизация действий » AutoIt » [решено] Копирование текста из веб страницы |
|
[решено] Копирование текста из веб страницы
|
Новый участник Сообщения: 11 |
Профиль | Отправить PM | Цитировать Подскажите пожалуйста.
Не могу понять как скопировать в буфер обмена текст из веб страницы, который находится в <td class="box_right" width="95%"> и всегда начинается с <span>Наименование:</span> и заканчивается перед <span>В наличии:</span>. И при этом что бы текст был как текст, а не как html код. |
|
Отправлено: 04:15, 28-02-2009 |
Googler Сообщения: 3665
|
Профиль | Отправить PM | Цитировать Цитата r35TnX:
|
|
Отправлено: 04:54, 28-02-2009 | #2 |
Для отключения данного рекламного блока вам необходимо зарегистрироваться или войти с учетной записью социальной сети. Если же вы забыли свой пароль на форуме, то воспользуйтесь данной ссылкой для восстановления пароля. |
Старожил Сообщения: 307
|
Профиль | Отправить PM | Цитировать Цитата r35TnX:
|
|
------- Отправлено: 13:39, 28-02-2009 | #3 |
Новый участник Сообщения: 11
|
Профиль | Отправить PM | Цитировать кусок html кода
но нужно что бы всё это (со второй по седьмую строчку) опировалось в виде обычного текста... без тегов, без форматирования. |
Отправлено: 01:15, 01-03-2009 | #4 |
Старожил Сообщения: 307
|
Профиль | Отправить PM | Цитировать Цитата:
#include <INet.au3> ;получение html кода из инет-страницы $sFile=_INetGetSource("тут ссылка") $pattern="(?s).*<td class=.?movie_box_right.? width=.?95%.?> (.*?)<div class=.?screenshot_box.+>.*?" ;поиск нужного куска html кода $sRezultat=StringregExpReplace($sFile,$pattern, "\1") ;отсеивание ненужного мусора. $sRezultat2=StringregExpReplace($sRezultat,"(<span>)|(</span>)|(<br/>)|(</a>)|(<a.*?>)", " ") $sF=fileopen("1.txt",2) fileWrite($sF,$sRezultat2) ;запись нужного куска в текстовый файл 1.txt MsgBox(0, "Body Text", $sRezultat2) ;нужно только в целях проверки результата |
||
------- Последний раз редактировалось beve, 02-03-2009 в 18:54. Отправлено: 02:48, 02-03-2009 | #5 |
Новый участник Сообщения: 11
|
Профиль | Отправить PM | Цитировать не хочет компилировать.
Цитата:
ссылка удалена. |
|
Последний раз редактировалось r35TnX, 02-03-2009 в 21:23. Отправлено: 11:42, 02-03-2009 | #6 |
Старожил Сообщения: 307
|
Профиль | Отправить PM | Цитировать Цитата:
P.S. И ссылку по-моему лучще удалить... |
|
------- Последний раз редактировалось beve, 02-03-2009 в 18:57. Отправлено: 12:19, 02-03-2009 | #7 |
Новый участник Сообщения: 11
|
Профиль | Отправить PM | Цитировать Я просто как можно дольше пытался вуалировать истинную страницу. (многие бы не правильно меня поняли. Это всего лишь работа и мне плевать что там жопы или цветы) Из-за этого придумывал другой текст, а структуру и теги оставлял такими же.
Вы пишете что там и близко такого нету... ну как же нету посмотрите 179 строчку исходного кода. Я сразу же удалю тему, как решится проблема. Поймите правильно. Спасибо за помощь |
Отправлено: 17:45, 02-03-2009 | #8 |
Старожил Сообщения: 307
|
Профиль | Отправить PM | Цитировать Цитата r35TnX:
#include <INet.au3> ;получение html кода из инет-страницы $sFile=_INetGetSource("тут ссылка") ;получение html кода из инет-страницы $pattern="(?s).*?movie_box_right.*?> (.*?)<div class=.*?screenshot_box.*" ;поиск нужного куска html кода $sRezultat=StringregExpReplace($sFile,$pattern, "\1") ;отсеивание ненужного мусора. $sRezultat2=StringregExpReplace($sRezultat,"(<.?span>)|(<br.*?>)|(<.?a>)|<a class=.*?>|(\t)", " ") MsgBox(0, "Body Text", $sRezultat2) ;нужно только в целях проверки результата ClipPut($sRezultat2) |
|
------- Отправлено: 18:37, 02-03-2009 | #9 |
Новый участник Сообщения: 11
|
Профиль | Отправить PM | Цитировать Спасибо beve. Вы мне очень помогли.
Будем удалять тему? или только ссылку удалить? |
Отправлено: 18:58, 02-03-2009 | #10 |
Участник сейчас на форуме | Участник вне форума | Автор темы | Сообщение прикреплено |
| |||||
Название темы | Автор | Информация о форуме | Ответов | Последнее сообщение | |
Интернет - [решено] Не открываются веб-страницы (хотя интернет работает) | lirq | Microsoft Windows Vista | 4 | 30-08-2009 15:31 | |
Ошибка - [решено] Не открываются сохраненные веб страницы | Redew | Microsoft Windows 2000/XP | 7 | 23-03-2009 08:33 | |
[решено] Поиск нужного текста в html коде страницы | ph0en1x | AutoIt | 8 | 16-02-2009 02:38 | |
[решено] Некорректное копирование текста из Internet Explorer | Taiss22 | Microsoft Windows 2000/XP | 18 | 08-12-2008 16:32 | |
загрузитьт веб-страницу с веб-страницы | AlexSaaa | Хочу все знать | 2 | 11-01-2005 17:07 |
|