|
|
|
как поисковик определяет принадлежность информации?
|
|||
|---|---|---|---|
|
#18+
Например сайт 1 разместил новость(которую сам написал) а сайт 2 её тупо перепечатал. Как поисковик узнаёт автора? Т.е. на какой сайт сперва идёт ссылка в поисковике? ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 16.11.2007, 20:36 |
|
||
|
как поисковик определяет принадлежность информации?
|
|||
|---|---|---|---|
|
#18+
Думаю, не секрет, что существует 3 основных формы подачи "новостей" - RSS (Really Simple Sindication), RDF (Resource Descriptor Framework) и Atom. Если мы рассматриваем понятие "новости" как некий объект в Сети, с которым проводят манипуляции (в основном - показ в блогах новостей, баннерах или рекламах), то да, конечно, легко можно определить принадлежность новости. Например, для RSS есть такие поля: для канала - copyright, lastBuildDate, managingEditor (их там много, но эти в контексте вопроса); для статьи (новости) - author, comments, guid, link, pubDate. Получают поля при чтении канала/статьи - это обычно xml-файл. Он парсится и вытаскиваются необходимые поля. Естественно, если "другой" новостной сайт взял новость, распарсил ее, взял только содержимое новости, поместил текст или даже создал свой RSS-канал, по которому передает дальше новость, то, думаю, нет необходимости объяснять, что такая информация абсолютно обезличенная? Можно было бы сравнивать время опубликования новости, но эти поля редактируемы, поэтому тоже бестолковое занятие. ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 16.11.2007, 21:19 |
|
||
|
|

start [/forum/topic.php?fid=22&msg=34946344&tid=1457343]: |
0ms |
get settings: |
10ms |
get forum list: |
13ms |
check forum access: |
4ms |
check topic access: |
4ms |
track hit: |
159ms |
get topic data: |
10ms |
get forum data: |
2ms |
get page messages: |
41ms |
get tp. blocked users: |
1ms |
| others: | 234ms |
| total: | 478ms |

| 0 / 0 |

Извините, этот баннер — требование Роскомнадзора для исполнения 152 ФЗ.
«На сайте осуществляется обработка файлов cookie, необходимых для работы сайта, а также для анализа использования сайта и улучшения предоставляемых сервисов с использованием метрической программы Яндекс.Метрика. Продолжая использовать сайт, вы даёте согласие с использованием данных технологий».
... ля, ля, ля ...