powered by simpleCommunicator - 2.0.60     © 2026 Programmizd 02
Целевая тема:
Создать новую тему:
Автор:
Закрыть
Цитировать
Форумы / PHP, Perl, Python [игнор отключен] [закрыт для гостей] / [PHP SEO] Роботы
16 сообщений из 16, страница 1 из 1
[PHP SEO] Роботы
    #38691793
Goror
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
Не устают ли они?!

В последние дни заметил, что два поисковых робота (один скорей всего google второй yandex), буквально каждую секунду сканируют страницы сайта, так вроде бы и не плохо, просто думаю может можно им как нибудь указать время работы, чтоб круглосуточно не загружать сервер запросами и тд? В файле Robots.txt прописал кое какие правила, но особо по моему они на него внимания не обращают, им как я понял одну ссылку шаблонную дай, и они её сами по циклам и словарям склоняют!?

Как правильно поступить, или это нормально?
...
Рейтинг: 0 / 0
[PHP SEO] Роботы
    #38692990
Goror
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
Никто не в курсе? Это нормальное поведение поисковых роботов? Они без остановки сканируют, каждую 1-2 секунды.
...
Рейтинг: 0 / 0
[PHP SEO] Роботы
    #38693119
vkle
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
Gororодин скорей всего google второй yandexНу так по айпишникам посмотреть можно, из каких подсетей они приходят.
...
Рейтинг: 0 / 0
[PHP SEO] Роботы
    #38693146
Goror
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
vkleGororодин скорей всего google второй yandexНу так по айпишникам посмотреть можно, из каких подсетей они приходят.

Ну я так и смотрю, если судить по IP то это роботы google (в основном) и яндекса (реже) , но заходят с разных IP, точней последние числа разные..

Просто меня не раз хостеры тревожили на счёт того что сервер перегружен запросами, вот и думаю, может боты его грузят..
...
Рейтинг: 0 / 0
[PHP SEO] Роботы
    #38694862
Фотография Areostar
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
GororНе устают ли они?!

В последние дни заметил, что два поисковых робота (один скорей всего google второй yandex), буквально каждую секунду сканируют страницы сайта, так вроде бы и не плохо, просто думаю может можно им как нибудь указать время работы, чтоб круглосуточно не загружать сервер запросами и тд? В файле Robots.txt прописал кое какие правила, но особо по моему они на него внимания не обращают, им как я понял одну ссылку шаблонную дай, и они её сами по циклам и словарям склоняют!?

Как правильно поступить, или это нормально?

Ну роботы устать не могут!!

А во всём остальном Гугл ни кого в свой планы и правела работы не посвящает!
...
Рейтинг: 0 / 0
[PHP SEO] Роботы
    #38694931
Goror
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
AreostarGororНе устают ли они?!

Ну роботы устать не могут!!


Я это заметил, у меня на сайте сейчас примерно ~470 тыс страниц, на данный момент, примерно по ~120 тысячам страниц роботы уже прошлись, это при том, что некоторые страницы они сканируют по несколько раз?! + Кэшированные страницы я не учитываю.


Я просто только сейчас стал за этим следить (1-2 недели))
...
Рейтинг: 0 / 0
[PHP SEO] Роботы
    #38695174
vkle
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
Gororнекоторые страницы они сканируют по несколько раз?!Наверно, они думают, что страница изменилась. Не пробовали настроить ласт-модифайд и установить там боле-менее реальное время создания страницы? Впрочем, поспрошайте СЕОшников на профильных ресурсах. Попадались там обсуждения поведения роботов.

PS: Перечитал название темы. Перечитал тему. Каким боком тут PHP притерся?
...
Рейтинг: 0 / 0
[PHP SEO] Роботы
    #38695201
Goror
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
vkleGororнекоторые страницы они сканируют по несколько раз?!Наверно, они думают, что страница изменилась. Не пробовали настроить ласт-модифайд и установить там боле-менее реальное время создания страницы? Впрочем, поспрошайте СЕОшников на профильных ресурсах. Попадались там обсуждения поведения роботов.

PS: Перечитал название темы. Перечитал тему. Каким боком тут PHP притерся?


На счёт почему сюда запостил, ну просто этот раздел наиболее близкий (на мой взгляд) к web-сайтам и соответственно к СЕО и тд.
Ну и походу, наверняка можно средствами php "отшивать" роботов ну или что-то подобное, направлять их на путь истинный, так сказать)


p.s Хотя проблема по-моему отступает, сегодня уже не так активно сканировали (может сегодня у них выходной?!)
...
Рейтинг: 0 / 0
[PHP SEO] Роботы
    #38695209
miksoft
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
Goror,

Подключите свой сайт в сервисы http://webmaster.yandex.ru и аналогичный у гугла. Там увидите некоторую статистику индексирования и т.п. информацию.
...
Рейтинг: 0 / 0
[PHP SEO] Роботы
    #38695256
vkle
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
GororНу и походу, наверняка можно средствами php "отшивать" роботов ну или что-то подобноеБанить? Да можно. По айпи и по строке юзер-агента. Можно и средствами .htaccess это сделать с гораздо меньшими затратами ресурсов.
Gororнаправлять их на путь истинныйПуть истинный - это управляющие инструкции, формат и размещение которых расписаны для каждого конкретного робота.
...
Рейтинг: 0 / 0
[PHP SEO] Роботы
    #38695262
Goror
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
vkleGororНу и походу, наверняка можно средствами php "отшивать" роботов ну или что-то подобноеБанить? Да можно. По айпи и по строке юзер-агента. Можно и средствами .htaccess это сделать с гораздо меньшими затратами ресурсов.
Gororнаправлять их на путь истинныйПуть истинный - это управляющие инструкции, формат и размещение которых расписаны для каждого конкретного робота.

Нее! Банить не хочу, у меня есть доступ и к девелоперским штучкам гугла, яндекса и тд. Но по сути там нет такой функции, как задать график сканирования сайта, интенсивность и тд.

В реале, мне наверно пока не так важна скорость индексации страниц, мне было бы достаточно 1 в минуту, но моментами как я замечал, в минуту по 30-40 новых страниц роботы сканировали. А это же нагрузка довольно приличная на сервер?!

И ещё мне просто интересно, если это только на начальных стадиях, то понять можно, пусть от сканируют всё и узбагоятся, но если так будет постоянно, то по моему, это не очень хорошо?!
...
Рейтинг: 0 / 0
[PHP SEO] Роботы
    #38695264
miksoft
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
GororИ ещё мне просто интересно, если это только на начальных стадиях, то понять можно, пусть от сканируют всё и узбагоятся, но если так будет постоянно, то по моему, это не очень хорошо?!Наоборот, "не очень хорошо" будет когда поисковики будут заходить на сайт раз в полгода, да и то - только на главную страницу.
...
Рейтинг: 0 / 0
[PHP SEO] Роботы
    #38695266
Goror
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
miksoftGororИ ещё мне просто интересно, если это только на начальных стадиях, то понять можно, пусть от сканируют всё и узбагоятся, но если так будет постоянно, то по моему, это не очень хорошо?!Наоборот, "не очень хорошо" будет когда поисковики будут заходить на сайт раз в полгода, да и то - только на главную страницу.


А! ну если это нормально, то тему можно закрывать!)

p.s Главное чтоб хостеры на меня в суд не подали бы, за что мой сайт спалил им сервак)
...
Рейтинг: 0 / 0
[PHP SEO] Роботы
    #38695268
vkle
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
Gororмоментами как я замечал, в минуту по 30-40 новых страниц роботы сканировали. А это же нагрузка довольно приличная на сервер?!Приличная или нет - тут Вам виднее. Для отдачи статичного контента (из файлов) это вообще не нагрузка. При формировании контента скриптом - сильно зависит от ресурсопрожорливости скрипта (используемого движка, алгоритмов, СУБД).



GororИ ещё мне просто интересно, если это только на начальных стадиях, то понять можно, пусть от сканируют всё и узбагоятся, но если так будет постоянноВ первом приближении как ведет себя порядочный робот... Получает страницу, фиксирует ее контент и время изменения (заголовок Last-Modified). Заходит в другой раз и смотрит время изменения. Если оно совпадает с предыдущим - значит страница меняется редко и ее можно сканировать реже. Такую выдачу заголовка вполне можно организовать, отдавая запрашиваемые страницы непосредственно из кеша как статику (вебсерверы обычно умеет сами читать и отдавать дату изменения файла на диске). Если время изменения страницы отсутствует или обновлено (не совпадает с данными от предыдущего захода) - значит и контент необходимо получить заново (а иначе невозможно узнать об изменении контента). Если при этом и контент изменился - значит есть смысл сканировать чаще. Таким образом, если время изменения страницы отсутствует или ставится текущее - то повода для ожидания снижения запросов контента от робота я не вижу. Разумеется, мое изложение не претендует на полноту и исключительную точность.
...
Рейтинг: 0 / 0
[PHP SEO] Роботы
    #38695270
vkle
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
GororГлавное чтоб хостеры на меня в суд не подали бы, за что мой сайт спалил им сервак)Успокойтесь, не подадут. Это не в их интересах :-) Просто ограничат (что обычно и делают) потребление ресурсов или отключат аккаунт и предложат перейти на более дорогой тарифный план или на выделенный сервер. Если же Ваш сайт "лежит" от банальной перегрузки - это хостеру как-то глубоко фиолетово.
...
Рейтинг: 0 / 0
[PHP SEO] Роботы
    #38695273
st_st
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
Crawl-delay в robots.txt и плюс у гугла в панели вебмастера выставить можно. Примерно на 20% кол-во запросов уменьшилось после выставления. А так поисковики долбят по 2-4 запроса в секунду, если страниц много.
...
Рейтинг: 0 / 0
16 сообщений из 16, страница 1 из 1
Форумы / PHP, Perl, Python [игнор отключен] [закрыт для гостей] / [PHP SEO] Роботы
Найденые пользователи ...
Разблокировать пользователей ...
Читали форум (0):
Пользователи онлайн (0):
x
x
Закрыть


Просмотр
0 / 0
Close
Debug Console [Select Text]