Этот баннер — требование Роскомнадзора для исполнения 152 ФЗ.
«На сайте осуществляется обработка файлов cookie, необходимых для работы сайта, а также для анализа использования сайта и улучшения предоставляемых сервисов с использованием метрической программы Яндекс.Метрика. Продолжая использовать сайт, вы даёте согласие с использованием данных технологий».
Политика конфиденциальности
|
|
|
[PHP SEO] Роботы
|
|||
|---|---|---|---|
|
#18+
Не устают ли они?! В последние дни заметил, что два поисковых робота (один скорей всего google второй yandex), буквально каждую секунду сканируют страницы сайта, так вроде бы и не плохо, просто думаю может можно им как нибудь указать время работы, чтоб круглосуточно не загружать сервер запросами и тд? В файле Robots.txt прописал кое какие правила, но особо по моему они на него внимания не обращают, им как я понял одну ссылку шаблонную дай, и они её сами по циклам и словарям склоняют!? Как правильно поступить, или это нормально? ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 09.07.2014, 12:54 |
|
||
|
[PHP SEO] Роботы
|
|||
|---|---|---|---|
|
#18+
Никто не в курсе? Это нормальное поведение поисковых роботов? Они без остановки сканируют, каждую 1-2 секунды. ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 10.07.2014, 12:28 |
|
||
|
[PHP SEO] Роботы
|
|||
|---|---|---|---|
|
#18+
Gororодин скорей всего google второй yandexНу так по айпишникам посмотреть можно, из каких подсетей они приходят. ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 10.07.2014, 13:30 |
|
||
|
[PHP SEO] Роботы
|
|||
|---|---|---|---|
|
#18+
vkleGororодин скорей всего google второй yandexНу так по айпишникам посмотреть можно, из каких подсетей они приходят. Ну я так и смотрю, если судить по IP то это роботы google (в основном) и яндекса (реже) , но заходят с разных IP, точней последние числа разные.. Просто меня не раз хостеры тревожили на счёт того что сервер перегружен запросами, вот и думаю, может боты его грузят.. ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 10.07.2014, 13:44 |
|
||
|
[PHP SEO] Роботы
|
|||
|---|---|---|---|
|
#18+
GororНе устают ли они?! В последние дни заметил, что два поисковых робота (один скорей всего google второй yandex), буквально каждую секунду сканируют страницы сайта, так вроде бы и не плохо, просто думаю может можно им как нибудь указать время работы, чтоб круглосуточно не загружать сервер запросами и тд? В файле Robots.txt прописал кое какие правила, но особо по моему они на него внимания не обращают, им как я понял одну ссылку шаблонную дай, и они её сами по циклам и словарям склоняют!? Как правильно поступить, или это нормально? Ну роботы устать не могут!! А во всём остальном Гугл ни кого в свой планы и правела работы не посвящает! ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 12.07.2014, 08:59 |
|
||
|
[PHP SEO] Роботы
|
|||
|---|---|---|---|
|
#18+
AreostarGororНе устают ли они?! Ну роботы устать не могут!! Я это заметил, у меня на сайте сейчас примерно ~470 тыс страниц, на данный момент, примерно по ~120 тысячам страниц роботы уже прошлись, это при том, что некоторые страницы они сканируют по несколько раз?! + Кэшированные страницы я не учитываю. Я просто только сейчас стал за этим следить (1-2 недели)) ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 12.07.2014, 13:38 |
|
||
|
[PHP SEO] Роботы
|
|||
|---|---|---|---|
|
#18+
Gororнекоторые страницы они сканируют по несколько раз?!Наверно, они думают, что страница изменилась. Не пробовали настроить ласт-модифайд и установить там боле-менее реальное время создания страницы? Впрочем, поспрошайте СЕОшников на профильных ресурсах. Попадались там обсуждения поведения роботов. PS: Перечитал название темы. Перечитал тему. Каким боком тут PHP притерся? ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 12.07.2014, 23:39 |
|
||
|
[PHP SEO] Роботы
|
|||
|---|---|---|---|
|
#18+
vkleGororнекоторые страницы они сканируют по несколько раз?!Наверно, они думают, что страница изменилась. Не пробовали настроить ласт-модифайд и установить там боле-менее реальное время создания страницы? Впрочем, поспрошайте СЕОшников на профильных ресурсах. Попадались там обсуждения поведения роботов. PS: Перечитал название темы. Перечитал тему. Каким боком тут PHP притерся? На счёт почему сюда запостил, ну просто этот раздел наиболее близкий (на мой взгляд) к web-сайтам и соответственно к СЕО и тд. Ну и походу, наверняка можно средствами php "отшивать" роботов ну или что-то подобное, направлять их на путь истинный, так сказать) p.s Хотя проблема по-моему отступает, сегодня уже не так активно сканировали (может сегодня у них выходной?!) ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 13.07.2014, 01:07 |
|
||
|
[PHP SEO] Роботы
|
|||
|---|---|---|---|
|
#18+
Goror, Подключите свой сайт в сервисы http://webmaster.yandex.ru и аналогичный у гугла. Там увидите некоторую статистику индексирования и т.п. информацию. ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 13.07.2014, 01:42 |
|
||
|
[PHP SEO] Роботы
|
|||
|---|---|---|---|
|
#18+
GororНу и походу, наверняка можно средствами php "отшивать" роботов ну или что-то подобноеБанить? Да можно. По айпи и по строке юзер-агента. Можно и средствами .htaccess это сделать с гораздо меньшими затратами ресурсов. Gororнаправлять их на путь истинныйПуть истинный - это управляющие инструкции, формат и размещение которых расписаны для каждого конкретного робота. ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 13.07.2014, 09:40 |
|
||
|
[PHP SEO] Роботы
|
|||
|---|---|---|---|
|
#18+
vkleGororНу и походу, наверняка можно средствами php "отшивать" роботов ну или что-то подобноеБанить? Да можно. По айпи и по строке юзер-агента. Можно и средствами .htaccess это сделать с гораздо меньшими затратами ресурсов. Gororнаправлять их на путь истинныйПуть истинный - это управляющие инструкции, формат и размещение которых расписаны для каждого конкретного робота. Нее! Банить не хочу, у меня есть доступ и к девелоперским штучкам гугла, яндекса и тд. Но по сути там нет такой функции, как задать график сканирования сайта, интенсивность и тд. В реале, мне наверно пока не так важна скорость индексации страниц, мне было бы достаточно 1 в минуту, но моментами как я замечал, в минуту по 30-40 новых страниц роботы сканировали. А это же нагрузка довольно приличная на сервер?! И ещё мне просто интересно, если это только на начальных стадиях, то понять можно, пусть от сканируют всё и узбагоятся, но если так будет постоянно, то по моему, это не очень хорошо?! ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 13.07.2014, 10:52 |
|
||
|
[PHP SEO] Роботы
|
|||
|---|---|---|---|
|
#18+
GororИ ещё мне просто интересно, если это только на начальных стадиях, то понять можно, пусть от сканируют всё и узбагоятся, но если так будет постоянно, то по моему, это не очень хорошо?!Наоборот, "не очень хорошо" будет когда поисковики будут заходить на сайт раз в полгода, да и то - только на главную страницу. ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 13.07.2014, 11:01 |
|
||
|
[PHP SEO] Роботы
|
|||
|---|---|---|---|
|
#18+
miksoftGororИ ещё мне просто интересно, если это только на начальных стадиях, то понять можно, пусть от сканируют всё и узбагоятся, но если так будет постоянно, то по моему, это не очень хорошо?!Наоборот, "не очень хорошо" будет когда поисковики будут заходить на сайт раз в полгода, да и то - только на главную страницу. А! ну если это нормально, то тему можно закрывать!) p.s Главное чтоб хостеры на меня в суд не подали бы, за что мой сайт спалил им сервак) ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 13.07.2014, 11:10 |
|
||
|
[PHP SEO] Роботы
|
|||
|---|---|---|---|
|
#18+
Gororмоментами как я замечал, в минуту по 30-40 новых страниц роботы сканировали. А это же нагрузка довольно приличная на сервер?!Приличная или нет - тут Вам виднее. Для отдачи статичного контента (из файлов) это вообще не нагрузка. При формировании контента скриптом - сильно зависит от ресурсопрожорливости скрипта (используемого движка, алгоритмов, СУБД). GororИ ещё мне просто интересно, если это только на начальных стадиях, то понять можно, пусть от сканируют всё и узбагоятся, но если так будет постоянноВ первом приближении как ведет себя порядочный робот... Получает страницу, фиксирует ее контент и время изменения (заголовок Last-Modified). Заходит в другой раз и смотрит время изменения. Если оно совпадает с предыдущим - значит страница меняется редко и ее можно сканировать реже. Такую выдачу заголовка вполне можно организовать, отдавая запрашиваемые страницы непосредственно из кеша как статику (вебсерверы обычно умеет сами читать и отдавать дату изменения файла на диске). Если время изменения страницы отсутствует или обновлено (не совпадает с данными от предыдущего захода) - значит и контент необходимо получить заново (а иначе невозможно узнать об изменении контента). Если при этом и контент изменился - значит есть смысл сканировать чаще. Таким образом, если время изменения страницы отсутствует или ставится текущее - то повода для ожидания снижения запросов контента от робота я не вижу. Разумеется, мое изложение не претендует на полноту и исключительную точность. ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 13.07.2014, 11:24 |
|
||
|
[PHP SEO] Роботы
|
|||
|---|---|---|---|
|
#18+
GororГлавное чтоб хостеры на меня в суд не подали бы, за что мой сайт спалил им сервак)Успокойтесь, не подадут. Это не в их интересах :-) Просто ограничат (что обычно и делают) потребление ресурсов или отключат аккаунт и предложат перейти на более дорогой тарифный план или на выделенный сервер. Если же Ваш сайт "лежит" от банальной перегрузки - это хостеру как-то глубоко фиолетово. ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 13.07.2014, 11:28 |
|
||
|
|

start [/forum/topic.php?fid=23&gotonew=1&tid=1462614]: |
0ms |
get settings: |
8ms |
get forum list: |
22ms |
check forum access: |
3ms |
check topic access: |
3ms |
track hit: |
35ms |
get topic data: |
11ms |
get first new msg: |
6ms |
get forum data: |
2ms |
get page messages: |
68ms |
get tp. blocked users: |
2ms |
| others: | 217ms |
| total: | 377ms |

| 0 / 0 |
