PHP - регулярные выражения: HELP - Компьютерный форум OSzone.net

Компьютерный форум OSzone.net (http://forum.oszone.net/index.php)

- Программирование и базы данных (http://forum.oszone.net/forumdisplay.php?f=21)

- - PHP - регулярные выражения: HELP (http://forum.oszone.net/showthread.php?t=29535)

никак не могу разобраться с регулярными выражениями, помогите
нужно выцепить имя картинки в строке(ах):
<img src="somefile.gif" alt="">
<img src=somefile.gif alt="">
<img src = somefile.gif>
с помощью функции preg_match_all

Код:

&lt;?php



$test = &lt;&lt;&lt;TEST

some text &lt;imG src=image.gif&gt; another text

text continues &lt;iMg src= &quot;image.png&quot; &nbsp;Alt=text&gt;

txt &lt; &nbsp;img &nbsp; &nbsp;src ='image.jpg' &nbsp;alt =&quot;text &nbsp;sfds&quot; sOme=&quot;other tags&quot;&gt;

text again &lt;img src=iMAGE.tiff alt=&quot;&quot;&gt; that's all, folks!

TEST;



// регэксп длинный, я его немножко разбил

$src_part = 'src\s*=\s*(&quot;[^&quot;]*&quot;|\'[^\']*\'|[^\s]+)';

$alt_part = '(\s+alt\s*=\s*(&quot;[^&quot;]*&quot;|\'[^\']*\'|[^\s]+))?';

preg_match_all('/&lt;\s*img\s+'.$src_part.$alt_part.'(.*?)&gt;/i', $test, $result);



echo '&lt;pre&gt;';

print_r($result);

echo '&lt;/pre&gt;';



?&gt;

Результат:

Код:

Array

(

 &nbsp; &nbsp;[0] =&gt; Array

 &nbsp; &nbsp; &nbsp; &nbsp;(

 &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp;[0] =&gt; &lt;imG src=image.gif&gt;

 &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp;[1] =&gt; &lt;iMg src= &quot;image.png&quot; &nbsp;Alt=text&gt;

 &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp;[2] =&gt; &lt; &nbsp;img &nbsp; &nbsp;src ='image.jpg' &nbsp;alt =&quot;text &nbsp;sfds&quot; sOme=&quot;other tags&quot;&gt;

 &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp;[3] =&gt; &lt;img src=iMAGE.tiff alt=&quot;&quot;&gt;

 &nbsp; &nbsp; &nbsp; &nbsp;)



 &nbsp; &nbsp;[1] =&gt; Array

 &nbsp; &nbsp; &nbsp; &nbsp;(

 &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp;[0] =&gt; image.gif

 &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp;[1] =&gt; &quot;image.png&quot;

 &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp;[2] =&gt; 'image.jpg'

 &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp;[3] =&gt; iMAGE.tiff

 &nbsp; &nbsp; &nbsp; &nbsp;)



 &nbsp; &nbsp;[2] =&gt; Array

 &nbsp; &nbsp; &nbsp; &nbsp;(

 &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp;[0] =&gt; 

 &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp;[1] =&gt; &nbsp; Alt=text

 &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp;[2] =&gt; &nbsp; alt =&quot;text &nbsp;sfds&quot;

 &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp;[3] =&gt; &nbsp;alt=&quot;&quot;

 &nbsp; &nbsp; &nbsp; &nbsp;)



 &nbsp; &nbsp;[3] =&gt; Array

 &nbsp; &nbsp; &nbsp; &nbsp;(

 &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp;[0] =&gt; 

 &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp;[1] =&gt; text

 &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp;[2] =&gt; &quot;text &nbsp;sfds&quot;

 &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp;[3] =&gt; &quot;&quot;

 &nbsp; &nbsp; &nbsp; &nbsp;)



 &nbsp; &nbsp;[4] =&gt; Array

 &nbsp; &nbsp; &nbsp; &nbsp;(

 &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp;[0] =&gt; 

 &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp;[1] =&gt; 

 &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp;[2] =&gt; &nbsp;sOme=&quot;other tags&quot;

 &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp;[3] =&gt; 

 &nbsp; &nbsp; &nbsp; &nbsp;)



)

Где здесь то, что тебе нужно и как убрать лишние кавычки, я думаю, понятно.

Важное замечание: после img обязательно должно быть src, а не какой-либо другой тэг. И alt, если он есть, дожен быть обязательно после src, иначе он не выцепится. Я когда-то давно делал на php парсер html (свой двигатель шаблонов делал), у него этих проблем не было бы, но он давно утерян :(

Тема перемещена сюда

Помогите пожалуйста с регулярным выражением-никак не получается написать нужное или хотя бы реально работающее.
Задача: выцеплять адреса вида любойвозможныйадрес.ru и не кушать при этом никакие адреса почтовых ящиков :sorry:
Уж как только не пытался - и через [^@], и через ретроспективную негативную проверку, и жёстким заданием - не получается или получается то, работы чего я не понимаю.
Исходник, понятно [a-zA-Z0-9]+\.[rR][uU]

обалдеваю я с людей: Delion Soulblade столько букв написал, а ничего конкретного не сказал. Может в этом и проблема, что не смог сформулировать чётких условий? Домены только второго уровня? Не русскоязычные? Из произвольного текста?

Ей-богу, не знаю уж в чём проблема и посему прошу помощи.
В моём случае без разницы какого уровня. Не русскоязычные. Из любой части любого текста, фразы или слова.
И, главное, чтобы при этом не затрагивались адреса почтовых ящиков.

Delion Soulblade, может быть пусть затрагиваются? Потом пройтись по массиву найденных адресов поиском, да исключить все вхождения с собакой.

Да вот нет...не будет никакого массива, фильтрацию нужно осуществлять "вживую".

Delion Soulblade, ещё раз повторяю: напиши чётко что должно извлекаться и откуда. В частности, как быть с длинными адресами - содержащими путь к файлу; просто имеющих дробь на конце и т.п. Их надо игнорировать или извлекать из них адрес верхнего домена?

Не нужно "извлекать". Задача одновременно сложнее и легче.
Требуется регулярное выражение (без привязки к какому-либо языку программирования), описывающее упоминание любого возможного упомянутого где и в чём угодно адрес сайта в зоне .ru (не URL!)
Обязательное условие: отсутствие реакции на любые адреса электронных почт в той же зоне.
[a-zA-Z0-9]+\.[rR][uU] не подходит только из-за того, что "ловит" почтовые адреса. Прошу помочь дописать это регулярное выражение, чтобы оно игнорировало их.