|
Парсер Fopen и Curl
|
|||
---|---|---|---|
#18+
Как то делал давно парсер знакомому, время прошло звонит говорит не работает (чел парсит сайт постав шика с товарами) смотрю Fopen и get_contets дают варнинги, значит скорее сего отключили на хостинге ? Пробую курлом -- либо висит либо получает во такое HTTP/1.1 502 Bad Gateway Server: nginx/1.8.0 Date: Tue, 24 Oct 2017 11:41:34 GMT Content-Type: text/html Content-Length: 537 Connection: keep-alive ETag: "55802425-219" An error occurred. Sorry, the page you are looking for is currently unavailable. Please try again later. If you are the system administrator of this resource then you should check the error log for details. Faithfully yours, nginx. К Од простой Код: php 1. 2. 3. 4. 5. 6. 7. 8. 9. 10. 11. 12. 13. 14. 15. 16.
... |
|||
:
Нравится:
Не нравится:
|
|||
24.10.2017, 14:46 |
|
Парсер Fopen и Curl
|
|||
---|---|---|---|
#18+
Может и намеренно забанили, а может и просто сервер поломался или перегружен. ... |
|||
:
Нравится:
Не нравится:
|
|||
24.10.2017, 16:33 |
|
Парсер Fopen и Curl
|
|||
---|---|---|---|
#18+
vkleМожет и намеренно забанили, а может и просто сервер поломался или перегружен. Дело в том что - на сайт с этого айпи доступ есть, и - есть еще парсер на Инди компонентах на делфи писанный мною, он этот сайт парсит и нормально работает, опять же с этого айпи, а вот спарсить ссылки используя ПХП что то никак (( ... |
|||
:
Нравится:
Не нравится:
|
|||
25.10.2017, 07:06 |
|
Парсер Fopen и Curl
|
|||
---|---|---|---|
#18+
ssaichДело в том что - на сайт с этого айпи доступ естьА кто говорит, что нету? Вы же получаете вполне внятный ответ от сервера:ssaich HTTP/1.1 502 Bad Gateway Обычно он говорит о том, что на сервере какие-то проблемы. И, вовсе, эти проблемы могут быть не на каждом запросе. ssaichесть еще парсер на Инди компонентах на делфи писанный мною, он этот сайт парсит и нормально работаетВ одно и то же время, будучи параллельно запущенными, они получают гарантировано разные ответы? Чудеса очень редко случаются в наше время. Сравните параметры идентичных запросов (заголовки, частоту) от него и от курла. ... |
|||
:
Нравится:
Не нравится:
|
|||
25.10.2017, 07:58 |
|
Парсер Fopen и Curl
|
|||
---|---|---|---|
#18+
vkle, Ну да, в одно и тоже время с браузера заходит, делфи парсер парсит а курл не хочет ... |
|||
:
Нравится:
Не нравится:
|
|||
26.10.2017, 08:11 |
|
Парсер Fopen и Curl
|
|||
---|---|---|---|
#18+
ssaich, А с идентичностью заголовков и запросов что и как? ... |
|||
:
Нравится:
Не нравится:
|
|||
26.10.2017, 09:32 |
|
Парсер Fopen и Curl
|
|||
---|---|---|---|
#18+
Ставьте charles или аналог, смотри что посылается в каких случаях. Обычно достаточно открыть страничку браузером, скопировать отправляемые заголовки и курлом закосить под браузер. С огромной вероятностью он просто достал их своим парсингом (а может и не он один) и сделали простую защиту от ботов Очень часто (с тем чем я сталкивался) заголовок host. ... |
|||
:
Нравится:
Не нравится:
|
|||
26.10.2017, 14:54 |
|
Парсер Fopen и Curl
|
|||
---|---|---|---|
#18+
upd у меня обычный file_get_contents получил страницу, без бубнов ... |
|||
:
Нравится:
Не нравится:
|
|||
26.10.2017, 14:56 |
|
Парсер Fopen и Curl
|
|||
---|---|---|---|
#18+
ssaich, открываю хромом- через консоль скопировал -Mozilla/5.0 (Windows NT 6.1; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/61.0.3163.100 Safari/537.36 Пробую курлом получить страницу- в консоли пусто ... |
|||
:
Нравится:
Не нравится:
|
|||
26.10.2017, 15:35 |
|
Парсер Fopen и Curl
|
|||
---|---|---|---|
#18+
У них же на этом же хосте http://it-on.ru/ страница тянется нормально ... |
|||
:
Нравится:
Не нравится:
|
|||
26.10.2017, 15:37 |
|
Парсер Fopen и Curl
|
|||
---|---|---|---|
#18+
ssaich, Да так то чем угодно страничка тянется нормально. Только, видимо, не с Вашего сервера, на который по некоторым параметрам то ли владельцы сайта ввели ограничение, то ли хостер. Однако, если Вы нашли способ всё-же получать данные, то используйте в точности те же самые параметры и при запросе курлом. Даже, можете хоть через непосредственно через сокет запрашивать, минуя различные программные прибамбасы. Протокол HTTP не слишком сложен, чтобы написать свою запрашивалку страниц. Удаленному серверу по барабану в общем случае, какое ПО Вы используете, если только это ПО не оставляет своих отметок. Конечно, есть ещё варианты, что curl на Вашем сервере то ли поломался, то ли как-то настроен странно. Или обращения от него идут не напрямую, а через какой-то прокси. Или, просто, идут не туда (это может от ДНС зависеть). ... |
|||
:
Нравится:
Не нравится:
|
|||
26.10.2017, 15:55 |
|
Парсер Fopen и Curl
|
|||
---|---|---|---|
#18+
vklessaich, Да так то чем угодно страничка тянется нормально. Только, видимо, не с Вашего сервера, на который по некоторым параметрам то ли владельцы сайта ввели ограничение, то ли хостер. Однако, если Вы нашли способ всё-же получать данные, то используйте в точности те же самые параметры и при запросе курлом. Даже, можете хоть через непосредственно через сокет запрашивать, минуя различные программные прибамбасы. Протокол HTTP не слишком сложен, чтобы написать свою запрашивалку страниц. Удаленному серверу по барабану в общем случае, какое ПО Вы используете, если только это ПО не оставляет своих отметок. Конечно, есть ещё варианты, что curl на Вашем сервере то ли поломался, то ли как-то настроен странно. Или обращения от него идут не напрямую, а через какой-то прокси. Или, просто, идут не туда (это может от ДНС зависеть). А возможно ли бан весит на подсеть ? у меня с рабочего компа не работет, с домашнего не работает и так далее.. но Делфи ПАРСЕР то пашет вот в чем парадокс ... |
|||
:
Нравится:
Не нравится:
|
|||
27.10.2017, 15:31 |
|
Парсер Fopen и Curl
|
|||
---|---|---|---|
#18+
Вот Код: pascal 1.
Был бы банан- не работало бы, страницу получаю без проблем.. курлом. fopen и тд не могу (( ... |
|||
:
Нравится:
Не нравится:
|
|||
27.10.2017, 15:47 |
|
Парсер Fopen и Curl
|
|||
---|---|---|---|
#18+
ssaich, Таккк )) в общем проблема такая- запустил я у себя Локальный Апач, и.. страницу получаю любым способом и без проблем, заливаю на сервер хостера. запускаю не пашет-- на сервере курл и прочее "все включено" в чем проблема уже может быть ? ... |
|||
:
Нравится:
Не нравится:
|
|||
27.10.2017, 16:16 |
|
Парсер Fopen и Curl
|
|||
---|---|---|---|
#18+
ssaichзаливаю на сервер хостера. запускаю не пашетАга, значит локализовали место проблемы. Что говорит по теме администратор этого сервера или техподдержка? ssaichБыл бы банан- не работало быВы, наверно, не представляете, сколько есть способов, которыми можно ненавязчиво сымитировать неисправность сервера :) ssaichА возможно ли бан весит на подсеть ?Да, без проблем. ssaichно Делфи ПАРСЕР то пашетКогда-нибудь, возможно, Вы посмотрите, а может быть, даже и нам покажете различия в их запросах, и в прочих параметрах, включая сетевые... ... |
|||
:
Нравится:
Не нравится:
|
|||
27.10.2017, 19:03 |
|
|
start [/forum/topic.php?fid=23&fpage=29&tid=1460477]: |
0ms |
get settings: |
8ms |
get forum list: |
11ms |
check forum access: |
3ms |
check topic access: |
3ms |
track hit: |
24ms |
get topic data: |
10ms |
get forum data: |
2ms |
get page messages: |
43ms |
get tp. blocked users: |
1ms |
others: | 12ms |
total: | 117ms |
0 / 0 |