Гость
Целевая тема:
Создать новую тему:
Автор:
Форумы / PHP, Perl, Python [игнор отключен] [закрыт для гостей] / Получить контент сайта Perl / 3 сообщений из 3, страница 1 из 1
15.08.2012, 16:39:06
    #37918042
RTYi
Участник
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Получить контент сайта Perl
Есть скрипт, который должен сохранять контент сайта в файл, но почему то вместо контента сохраняется всякая ерунда. Файл с результатом прикреплен.

Код: php
1.
2.
3.
4.
5.
6.
7.
8.
9.
10.
11.
12.
13.
14.
15.
16.
17.
18.
19.
20.
21.
22.
23.
24.
25.
26.
27.
28.
use LWP::UserAgent;
use HTML::Parse;
use HTTP::Cookies;

my $url = 'http://www.kinopoisk.ru/film/30000';

my $ua = LWP::UserAgent->new('agent' => 'Mozilla/4.0 (compatible; MSIE 7.0; Windows NT 5.1; .NET CLR 2.0.50727)');
push @{ $ua->requests_redirectable }, 'POST';
$ua->default_headers->push_header('Accept' => 'text/xml,application/xml,application/xhtml+xml,text/html;q=0.9,text/plain;q=0.8,image/png,*/*;q=0.5');
$ua->default_headers->push_header('Accept-Language' => 'ru,en-us;q=0.7,en;q=0.3');
$ua->default_headers->push_header('Accept-Encoding' => 'gzip,deflate');
$ua->default_headers->push_header('Accept-Charset' => 'ISO-8859-1,utf-8;q=0.7,*;q=0.7');
$ua->default_headers->push_header('Keep-Alive' => '300');
$ua->default_headers->push_header('Referer' => $url );
$ua->cookie_jar(HTTP::Cookies->new(file => "lwpcookies.txt",autosave => 1));

$ua->timeout(15);


my $request = HTTP::Request->new('GET');
$request->url($url);
 
my $response = $ua->request($request);
 
 @nicknames=$response->content;

open (CONTENT, ">CONTENT.html");
print CONTENT join "\n", @nicknames;
...
Рейтинг: 0 / 0
15.08.2012, 17:16:42
    #37918162
RTYi
Участник
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Получить контент сайта Perl
Таки разобрался,

Нужно убрать сжатие $ua->default_headers->push_header('Accept-Encoding' => 'gzip,deflate');
...
Рейтинг: 0 / 0
15.08.2012, 22:25:41
    #37918478
Anjey aka PM
Участник
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Получить контент сайта Perl
RTYi,

Ну или уметь его понимать, раз уж заявили, как грится: "назвался груздем, полезай в корзинку"
...
Рейтинг: 0 / 0
Форумы / PHP, Perl, Python [игнор отключен] [закрыт для гостей] / Получить контент сайта Perl / 3 сообщений из 3, страница 1 из 1
Найденые пользователи ...
Разблокировать пользователей ...
Читали форум (0):
Пользователи онлайн (0):
x
x
Закрыть


Просмотр
0 / 0
Close
Debug Console [Select Text]