Гость
Целевая тема:
Создать новую тему:
Автор:
Форумы / PHP, Perl, Python [игнор отключен] [закрыт для гостей] / загвоздка с парсером и phpQuery / 9 сообщений из 9, страница 1 из 1
03.03.2015, 16:25
    #38893770
black_height
Гость
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
загвоздка с парсером и phpQuery
Столкнулся с проблемой парсинга сайтов, данные которых можно получить либо после регистрации, либо после срабатывания скрипта.
пример - https://tender.privatbank.ua/tenders/ каким образом переписать скрипт, чтобы спарсить список тендеров?

Сейчас код в таком виде:
Код: php
1.
2.
3.
4.
5.
6.
7.
8.
9.
10.
11.
12.
13.
14.
15.
16.
   require ('phpQuery/phpQuery.php');
   function pars_site($searchstr, $urlsearchsite)
	{
		$data = file_get_contents($urlsearchsite);
		$html = phpQuery::newDocument($data);
		echo ('<table  style="font-size: 14px" bgcolor="#CAFF70" border="1" cellspacing="0" cellpadding="2">');
		foreach ($html->find('table')->find('tr') as $el)
		{
			$substr_count = substr_count(pq($el), $searchstr);
			if  ($substr_count>0) {
					echo pq($el);
					}
		}
		echo ("</table>");
}
pars_site("метал", "http://dmkd.dp.ua/node/949");
...
Рейтинг: 0 / 0
03.03.2015, 16:42
    #38893814
ScareCrow
Участник
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
загвоздка с парсером и phpQuery
яваскрипт ты на php не выполнишь никак
...
Рейтинг: 0 / 0
05.03.2015, 01:29
    #38895307
black_height
Гость
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
загвоздка с парсером и phpQuery
Спасибо, столкнулся с еще одной проблемой: не работает скрипт если сайт, с которого парсится инфа в кодировке charset=Windows-1251, а у меня соответственно юникод. Каким образом указать кодировку?
...
Рейтинг: 0 / 0
05.03.2015, 01:31
    #38895309
SharuPoNemnogu
Участник
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
загвоздка с парсером и phpQuery
black_height,

iconv
...
Рейтинг: 0 / 0
06.03.2015, 16:12
    #38897410
black_height
Гость
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
загвоздка с парсером и phpQuery
Помогите.
Код: php
1.
2.
3.
4.
5.
6.
$data = file_get_contents("http://www.zsmk.ru/ozr.jsp");
$html = phpQuery::newDocument($data);
foreach ($html->find("td.bcell0")->find("a") as $el)
	{
	echo iconv('KOI8-R', 'UTF-8', pq($el))."<br>";
}


На выходе нечитабельный текст. Где ошибка?
...
Рейтинг: 0 / 0
06.03.2015, 16:16
    #38897417
kunaksergey
Гость
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
загвоздка с парсером и phpQuery
black_heightПомогите.
Код: php
1.
2.
3.
4.
5.
6.
$data = file_get_contents("http://www.zsmk.ru/ozr.jsp");
$html = phpQuery::newDocument($data);
foreach ($html->find("td.bcell0")->find("a") as $el)
	{
	echo iconv('KOI8-R', 'UTF-8', pq($el))."<br>";
}


На выходе нечитабельный текст. Где ошибка?
а с чего вы взяли, что там 'KOI8-R'. Если меня зрение не обманывает-то 'windows-1251'
...
Рейтинг: 0 / 0
06.03.2015, 16:26
    #38897430
black_height
Гость
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
загвоздка с парсером и phpQuery
kunaksergey,
Это уже по мере тестов не исправил. Изначально поставил windows-1251, выдает что-то вроде:
¹15/0254-07 ÊÐ. Îáæèìíîé öåõ. Âåíòèëÿòîð Ö4-76 ¹20 (ìà øèííûé çà ë ñòà íà 1250) . Âåíòèëÿòîð Ö4-76 ¹16 (2 øò, ìà øèííûé çà ë ÍÇÑ). , Èíâ.¹: 161000000750-00; 161000000753-00
...
Рейтинг: 0 / 0
06.03.2015, 16:40
    #38897452
kunaksergey
Гость
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
загвоздка с парсером и phpQuery
black_height,

без конвертации в браузере нормально выводится?
...
Рейтинг: 0 / 0
06.03.2015, 18:03
    #38897519
zirra
Участник
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
загвоздка с парсером и phpQuery
black_height> $data = file_get_contents(" http://www.zsmk.ru/ozr.jsp");
> $html = phpQuery::newDocument($data);
> foreach ($html->find("td.bcell0")->find("a") as $el)
> {
> echo iconv('KOI8-R', 'UTF-8', pq($el))."<br>";
> }
> На выходе нечитабельный текст. Где ошибка?
У меня и вывод БЕЗ [b 
iconv[/b] выдаёт малочитаемый...]


--
Vladimir A.Bakhvaloff
Posted via ActualForum NNTP Server 1.5
...
Рейтинг: 0 / 0
Форумы / PHP, Perl, Python [игнор отключен] [закрыт для гостей] / загвоздка с парсером и phpQuery / 9 сообщений из 9, страница 1 из 1
Найденые пользователи ...
Разблокировать пользователей ...
Читали форум (0):
Пользователи онлайн (0):
x
x
Закрыть


Просмотр
0 / 0
Close
Debug Console [Select Text]