Имя пользователя:
Пароль:  
Помощь | Регистрация | Забыли пароль?  | Правила  

Компьютерный форум OSzone.net » Программирование, базы данных и автоматизация действий » AutoIt » [решено] Копирование текста из веб страницы

Ответить
Настройки темы
[решено] Копирование текста из веб страницы

Новый участник


Сообщения: 11
Благодарности: 0

Профиль | Отправить PM | Цитировать


Подскажите пожалуйста.
Не могу понять как скопировать в буфер обмена текст из веб страницы, который находится в <td class="box_right" width="95%"> и всегда начинается с <span>Наименование:</span> и заканчивается перед <span>В наличии:</span>. И при этом что бы текст был как текст, а не как html код.

Отправлено: 04:15, 28-02-2009

 

Googler


Сообщения: 3665
Благодарности: 1563

Профиль | Отправить PM | Цитировать


Цитата r35TnX:
при этом что бы текст был как текст, а не как html код »
из вашего объяснения непонятно, что может находиться между "начинается" и "заканчивается" - текст или html-код, не проще ли было приложить пример содержимого страницы?

Отправлено: 04:54, 28-02-2009 | #2



Для отключения данного рекламного блока вам необходимо зарегистрироваться или войти с учетной записью социальной сети.

Если же вы забыли свой пароль на форуме, то воспользуйтесь данной ссылкой для восстановления пароля.


Аватара для beve

Старожил


Сообщения: 307
Благодарности: 137

Профиль | Отправить PM | Цитировать


Цитата r35TnX:
Подскажите пожалуйста.
Не могу понять как скопировать в буфер обмена текст из веб страницы »
Если вы тему создали, то пожалуйста и корректно спрашивайте. Или ссылку выложите на веб страницу или кусок html кода начиная с <span>Наименование:</span> и заканчивая на <span>В наличии:</span>, но при условии, что такой кусок кода, который начинается с <span>Наименование:</span> и заканчивается на <span>В наличии:</span> в тексте только один.

-------
Не в кількості знань полягає освіта, а в повному розумінні і вмілому використанні того, що знаєш.


Отправлено: 13:39, 28-02-2009 | #3


Новый участник


Сообщения: 11
Благодарности: 0

Профиль | Отправить PM | Цитировать


кусок html кода
HTML код: Выделить весь код
<td class="movie_box_right" width="95%"> <span>Джуно</span> <br/> <span>Оригинальное название:</span> Juno <br/> <span>Год выпуска:</span> 2007 <br/> <span>Режиссер:</span> Джейсон Рейтман <br/> <span>Жанр:</span> <a class="genre" href="/cat/camedy/">Комедия</a> , <a class="genre" href="/cat/dram/">Драмма</a> <br/> <span>В ролях:</span> Эллен Пейдж Дженнифер Гарнер Джейсон Бейтман Майкл Сера Оливия Тирлби <br/> <span>Описание:</span> Беременная старшеклассница Джуно отыскивает приятную семейную пару, желающую усыновить ее не ребенка. Перед девушкой поднимаются совсем не детские задачи : словно делать? что довольно лучше ради ее детворы и точно найти себя? Джуно принимает неестественное решение… <br/> <div class="screenshot_box">

но нужно что бы всё это (со второй по седьмую строчку) опировалось в виде обычного текста... без тегов, без форматирования.

Отправлено: 01:15, 01-03-2009 | #4


Аватара для beve

Старожил


Сообщения: 307
Благодарности: 137

Профиль | Отправить PM | Цитировать


Цитата:
Подскажите пожалуйста.
Не могу понять как скопировать в буфер обмена текст из веб страницы
Вот примерно так:
Код: Выделить весь код
#include <INet.au3>
;получение html кода из инет-страницы
$sFile=_INetGetSource("тут ссылка")

$pattern="(?s).*<td class=.?movie_box_right.? width=.?95%.?> (.*?)<div class=.?screenshot_box.+>.*?"
;поиск нужного куска html кода
$sRezultat=StringregExpReplace($sFile,$pattern, "\1")
;отсеивание ненужного мусора.
$sRezultat2=StringregExpReplace($sRezultat,"(<span>)|(</span>)|(<br/>)|(</a>)|(<a.*?>)", " ")
$sF=fileopen("1.txt",2) 
fileWrite($sF,$sRezultat2) ;запись нужного куска в текстовый файл 1.txt
MsgBox(0, "Body Text", $sRezultat2) ;нужно только в целях проверки результата
Только тут не в буфер а в файл...Но если будет работать, то не трудно вместо сохранения в файл написать копировать в буфер.

-------
Не в кількості знань полягає освіта, а в повному розумінні і вмілому використанні того, що знаєш.


Последний раз редактировалось beve, 02-03-2009 в 18:54.

Это сообщение посчитали полезным следующие участники:

Отправлено: 02:48, 02-03-2009 | #5


Новый участник


Сообщения: 11
Благодарности: 0

Профиль | Отправить PM | Цитировать


не хочет компилировать.

Цитата:
WARNING: $Rezultat2: possibly used before declaration. fileWrite($sF,$Rezultat2)
но даже если $Rezultat2 заменить на $sRezultat2 то скрипт почемуто копирует весь исходный текст страницы.

ссылка удалена.

Последний раз редактировалось r35TnX, 02-03-2009 в 21:23.


Отправлено: 11:42, 02-03-2009 | #6


Аватара для beve

Старожил


Сообщения: 307
Благодарности: 137

Профиль | Отправить PM | Цитировать


Цитата:
не хочет компилировать.
Извините, но и не захочет, ибо то вы одно пишете, начинается всегда так... окончается так, а теперь выявляется что там такого и близко нету! Пример я показал, а остальное уже делайте сами.
P.S. И ссылку по-моему лучще удалить...

-------
Не в кількості знань полягає освіта, а в повному розумінні і вмілому використанні того, що знаєш.


Последний раз редактировалось beve, 02-03-2009 в 18:57.


Отправлено: 12:19, 02-03-2009 | #7


Новый участник


Сообщения: 11
Благодарности: 0

Профиль | Отправить PM | Цитировать


Я просто как можно дольше пытался вуалировать истинную страницу. (многие бы не правильно меня поняли. Это всего лишь работа и мне плевать что там жопы или цветы) Из-за этого придумывал другой текст, а структуру и теги оставлял такими же.
Вы пишете что там и близко такого нету... ну как же нету посмотрите 179 строчку исходного кода. Я сразу же удалю тему, как решится проблема.
Поймите правильно. Спасибо за помощь

Отправлено: 17:45, 02-03-2009 | #8


Аватара для beve

Старожил


Сообщения: 307
Благодарности: 137

Профиль | Отправить PM | Цитировать


Цитата r35TnX:
ну как же нету посмотрите »
Действительно, есть. Вот:
Код: Выделить весь код
#include <INet.au3>
;получение html кода из инет-страницы
$sFile=_INetGetSource("тут ссылка")
;получение html кода из инет-страницы
$pattern="(?s).*?movie_box_right.*?> (.*?)<div class=.*?screenshot_box.*"
;поиск нужного куска html кода
$sRezultat=StringregExpReplace($sFile,$pattern, "\1")
;отсеивание ненужного мусора.
$sRezultat2=StringregExpReplace($sRezultat,"(<.?span>)|(<br.*?>)|(<.?a>)|<a class=.*?>|(\t)", " ")
MsgBox(0, "Body Text", $sRezultat2) ;нужно только в целях проверки результата
ClipPut($sRezultat2)

-------
Не в кількості знань полягає освіта, а в повному розумінні і вмілому використанні того, що знаєш.

Это сообщение посчитали полезным следующие участники:

Отправлено: 18:37, 02-03-2009 | #9


Новый участник


Сообщения: 11
Благодарности: 0

Профиль | Отправить PM | Цитировать


Спасибо beve. Вы мне очень помогли.
Будем удалять тему? или только ссылку удалить?

Отправлено: 18:58, 02-03-2009 | #10



Компьютерный форум OSzone.net » Программирование, базы данных и автоматизация действий » AutoIt » [решено] Копирование текста из веб страницы

Участник сейчас на форуме Участник сейчас на форуме Участник вне форума Участник вне форума Автор темы Автор темы Шапка темы Сообщение прикреплено

Похожие темы
Название темы Автор Информация о форуме Ответов Последнее сообщение
Интернет - [решено] Не открываются веб-страницы (хотя интернет работает) lirq Microsoft Windows Vista 4 30-08-2009 15:31
Ошибка - [решено] Не открываются сохраненные веб страницы Redew Microsoft Windows 2000/XP 7 23-03-2009 08:33
[решено] Поиск нужного текста в html коде страницы ph0en1x AutoIt 8 16-02-2009 02:38
[решено] Некорректное копирование текста из Internet Explorer Taiss22 Microsoft Windows 2000/XP 18 08-12-2008 16:32
загрузитьт веб-страницу с веб-страницы AlexSaaa Хочу все знать 2 11-01-2005 17:07




 
Переход