Гость
Целевая тема:
Создать новую тему:
Автор:
Форумы / PHP, Perl, Python [игнор отключен] [закрыт для гостей] / Регулярное выражение / 3 сообщений из 3, страница 1 из 1
18.01.2015, 08:50
    #38856956
Zhenek
Участник
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Регулярное выражение
Добрый день.

в коде страницы имеется такой кусок:

Код: html
1.
2.
3.
4.
5.
6.
7.
8.
9.
10.
11.
12.
13.
14.
15.
16.
17.
18.
19.
20.
21.
22.
<dt class="tb-property-type">&#39068;&#33394;</dt>
<dd>
<ul data-property="&#39068;&#33394;" class="J_TSaleProp tb-clearfix tb-img">
<li data-value="1627207:28320"  >
<a href="#" style="background:url(http://img03.taobaocdn.com/bao/uploaded/i3/1711261452/TB2xYPabXXXXXX9XpXXXXXXXXXX_!!1711261452.jpg_30x30.jpg) center no-repeat;">
<span>&#30333;&#33394;</span>
</a>
<i>&#24050;&#36873;&#20013;</i>
</li>
<li data-value="1627207:28341"  >
<a href="#" style="background:url(http://img04.taobaocdn.com/bao/uploaded/i4/1711261452/TB21pjPaVXXXXaGXXXXXXXXXXXX_!!1711261452.jpg_30x30.jpg) center no-repeat;">
<span>&#40657;&#33394;</span>
</a>
<i>&#24050;&#36873;&#20013;</i>
</li>
<li data-value="1627207:3232478"  >
<a href="#" style="background:url(http://img02.taobaocdn.com/bao/uploaded/i2/1711261452/TB2g3vNaVXXXXczXXXXXXXXXXXX_!!1711261452.jpg_30x30.jpg) center no-repeat;">
<span>&#28784;&#33394;</span>
</a>
<i>&#24050;&#36873;&#20013;</i>
</li>
</ul></dd></dl>



Мне нужно получить картинки этих 3х параметров (номер,ссылка на картинку и название)

сначала попробовал так: удалил все переносы строк из кода и работал с ним как с 1 строкой.

Код: php
1.
<li data-value="(\d{1,10}:\d{1,10})"  ><a href="\#" style="background:url\((.*?)\) center no-repeat;"><span>(.*?)</span></a>



пробовал и как с несколькими строками.

Проблема:
На денвере, на сайтах тестерах регулярок все работает, а вот при загрузке на сервер он не находит строку.
Пробовал как мог диагностировать, и поэтапно, и проверять удаляет ли пробелы. ни в какую.
...
Рейтинг: 0 / 0
18.01.2015, 13:01
    #38856994
kunaksergey
Гость
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Регулярное выражение
Zhenek,
Код: php
1.
2.
3.
4.
5.
6.
7.
8.
9.
10.
11.
12.
13.
14.
15.
16.
17.
18.
19.
20.
21.
22.
23.
24.
25.
26.
27.
<?php
$array=array();  //результирующий массив
$str="cod.html"; //файл с html
$pattern="/http:(.*).jpg/"; //шаблог для jpg
$i=0;						//счетчик

$doc=new DOMDocument();          
$doc->loadHTMLFile($str);    //читаем файл    
$li = $doc->getElementsByTagName('li'); // все <li>

foreach ($li as $node) {
		
   if ($node->hasAttribute("data-value")){   // Отбрасываем li без data-value
	  $array[$i]['data-value']=$node->getAttribute('data-value'); //сохраняем //<li data-value >
	 	$a=$node->getElementsByTagName('a')->item(0);   //выбираем <a> тега <li>
   		$str= $a->getAttribute('style');                //получаем атрибут style
   		preg_match($pattern, $str, $matches, PREG_OFFSET_CAPTURE); //выкусываем картинку
   		$array[$i]['style']=$matches[0][0];                        
   		$span=$node->getElementsByTagName('span')->item(0);   //тег <span>
   		$array[$i]['span']=$span->nodeValue;					//картинка в span
		$i++;
	}
}

var_dump($array);   //результат

?>
...
Рейтинг: 0 / 0
18.01.2015, 13:03
    #38856995
vkle
Участник
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Регулярное выражение
Код
Код: php
1.
2.
3.
4.
5.
6.
7.
8.
9.
10.
11.
12.
13.
14.
15.
16.
17.
18.
19.
20.
21.
22.
23.
24.
25.
26.
27.
28.
29.
<?php
$text = <<<TEXT
<dt class="tb-property-type">&#39068;&#33394;</dt>
<dd>
<ul data-property="&#39068;&#33394;" class="J_TSaleProp tb-clearfix tb-img">
<li data-value="1627207:28320"  >
<a href="#" style="background:url(http://img03.taobaocdn.com/bao/uploaded/i3/1711261452/TB2xYPabXXXXXX9XpXXXXXXXXXX_!!1711261452.jpg_30x30.jpg) center no-repeat;">
<span>&#30333;&#33394;</span>
</a>
<i>&#24050;&#36873;&#20013;</i>
</li>
<li data-value="1627207:28341"  >
<a href="#" style="background:url(http://img04.taobaocdn.com/bao/uploaded/i4/1711261452/TB21pjPaVXXXXaGXXXXXXXXXXXX_!!1711261452.jpg_30x30.jpg) center no-repeat;">
<span>&#40657;&#33394;</span>
</a>
<i>&#24050;&#36873;&#20013;</i>
</li>
<li data-value="1627207:3232478"  >
<a href="#" style="background:url(http://img02.taobaocdn.com/bao/uploaded/i2/1711261452/TB2g3vNaVXXXXczXXXXXXXXXXXX_!!1711261452.jpg_30x30.jpg) center no-repeat;">
<span>&#28784;&#33394;</span>
</a>
<i>&#24050;&#36873;&#20013;</i>
</li>
</ul></dd></dl>
TEXT;

$reg = '/<li\s+data-value="(\d+:\d+)".+url\((.+)\).+<span>(.+)<\/span>/smU';
preg_match_all($reg, $text, $matches);
var_dump($matches);



Результат
Код: php
1.
2.
3.
4.
5.
6.
7.
8.
9.
10.
11.
12.
13.
14.
15.
16.
17.
18.
19.
20.
21.
22.
23.
24.
25.
26.
27.
28.
29.
30.
31.
32.
33.
34.
35.
36.
37.
38.
39.
40.
41.
42.
43.
44.
45.
$ php r.php
array(4) {
  [0]=>
  array(3) {
    [0]=>
    string(227) "<li data-value="1627207:28320"  >
<a href="#" style="background:url(http://img03.taobaocdn.com/bao/uploaded/i3/1711261452/TB2xYPabXXXXXX9XpXXXXXXXXXX_!!1711261452.jpg_30x30.jpg) center no-repeat;">
<span>&#30333;&#33394;</span>"
    [1]=>
    string(227) "<li data-value="1627207:28341"  >
<a href="#" style="background:url(http://img04.taobaocdn.com/bao/uploaded/i4/1711261452/TB21pjPaVXXXXaGXXXXXXXXXXXX_!!1711261452.jpg_30x30.jpg) center no-repeat;">
<span>&#40657;&#33394;</span>"
    [2]=>
    string(229) "<li data-value="1627207:3232478"  >
<a href="#" style="background:url(http://img02.taobaocdn.com/bao/uploaded/i2/1711261452/TB2g3vNaVXXXXczXXXXXXXXXXXX_!!1711261452.jpg_30x30.jpg) center no-repeat;">
<span>&#28784;&#33394;</span>"
  }
  [1]=>
  array(3) {
    [0]=>
    string(13) "1627207:28320"
    [1]=>
    string(13) "1627207:28341"
    [2]=>
    string(15) "1627207:3232478"
  }
  [2]=>
  array(3) {
    [0]=>
    string(108) "http://img03.taobaocdn.com/bao/uploaded/i3/1711261452/TB2xYPabXXXXXX9XpXXXXXXXXXX_!!1711261452.jpg_30x30.jpg"
    [1]=>
    string(108) "http://img04.taobaocdn.com/bao/uploaded/i4/1711261452/TB21pjPaVXXXXaGXXXXXXXXXXXX_!!1711261452.jpg_30x30.jpg"
    [2]=>
    string(108) "http://img02.taobaocdn.com/bao/uploaded/i2/1711261452/TB2g3vNaVXXXXczXXXXXXXXXXXX_!!1711261452.jpg_30x30.jpg"
  }
  [3]=>
  array(3) {
    [0]=>
    string(16) "&#30333;&#33394;"
    [1]=>
    string(16) "&#40657;&#33394;"
    [2]=>
    string(16) "&#28784;&#33394;"
  }
}
...
Рейтинг: 0 / 0
Форумы / PHP, Perl, Python [игнор отключен] [закрыт для гостей] / Регулярное выражение / 3 сообщений из 3, страница 1 из 1
Найденые пользователи ...
Разблокировать пользователей ...
Читали форум (0):
Пользователи онлайн (0):
x
x
Закрыть


Просмотр
0 / 0
Close
Debug Console [Select Text]