|
Парсер сайта
|
|||
---|---|---|---|
#18+
Подскажите, как правильно получить html страницы http://goskatalog.ru/portal/#/collections?museumIds=1668 Там каталог отображается скриптом, при парсинге получаю текст макета, а сам каталог не вижу. Нужно выбрать экспонаты ... |
|||
:
Нравится:
Не нравится:
|
|||
21.09.2016, 11:31 |
|
Парсер сайта
|
|||
---|---|---|---|
#18+
Fedor32, Если не разжевывать, то вам помогу: понимание REST-архитектуры умение пользоваться консолью браузера ... |
|||
:
Нравится:
Не нравится:
|
|||
21.09.2016, 11:47 |
|
Парсер сайта
|
|||
---|---|---|---|
#18+
Да в консоли то я вижу, мне нужно с помощью PHP регулярно переносить в свою базу сведения об этих экспонатах ... |
|||
:
Нравится:
Не нравится:
|
|||
21.09.2016, 14:20 |
|
Парсер сайта
|
|||
---|---|---|---|
#18+
Fedor32Да в консоли то я вижу, мне нужно с помощью PHP регулярно переносить в свою базу сведения об этих экспонатах тогда придётся аккуратно вытаскивать с сервера данные так же как это делает javascript на странице то первого изменения протокола... ... |
|||
:
Нравится:
Не нравится:
|
|||
21.09.2016, 15:10 |
|
Парсер сайта
|
|||
---|---|---|---|
#18+
Fedor32, Подозреваю что каталог аджаксом вытягивают!? тогда дело усложняется! так как PHP вытягивает код который сервер отдаётся сервером браузеру. JS на этом этапе работать ещё не начал!! (( ... |
|||
:
Нравится:
Не нравится:
|
|||
22.09.2016, 19:43 |
|
Парсер сайта
|
|||
---|---|---|---|
#18+
AreostarFedor32, Подозреваю что каталог аджаксом вытягивают!? тогда дело усложняется! так как PHP вытягивает код который сервер отдаётся сервером браузеру. JS на этом этапе работать ещё не начал!! (( Дак в этом и суть, что вместо парсинга страницы можно просто дать прямой запрос на скрипт, который возвращает нужную информацию в виде json массива. Напрягают только кода в куках, но curl умеет с куками работать (если вдруг это защита от кражи информации). Но если это защита, то обсуждение её обхода, если не ошибаюсь, противоречит правилам форума :) Тогда уж сами думайте как с этим бороться... ... |
|||
:
Нравится:
Не нравится:
|
|||
19.10.2016, 00:36 |
|
Парсер сайта
|
|||
---|---|---|---|
#18+
хера там подозревать - если разуть глаза - легко увидеть, что сайт на агуляре сделан ... |
|||
:
Нравится:
Не нравится:
|
|||
19.10.2016, 00:40 |
|
|
start [/forum/topic.php?fid=23&fpage=39&tid=1460886]: |
0ms |
get settings: |
10ms |
get forum list: |
13ms |
check forum access: |
4ms |
check topic access: |
4ms |
track hit: |
37ms |
get topic data: |
11ms |
get forum data: |
3ms |
get page messages: |
51ms |
get tp. blocked users: |
1ms |
others: | 320ms |
total: | 454ms |
0 / 0 |