Добрый день. Возникла такая проблема при работе с Яндекс.Сервер. Пробую использовать его для поиска по сайту. Операционная система - Open SUSE. Сервер запускается, создает индексы, ищет по созданным индексам. Но вот обнаружилась проблема в индексаторе - он почему-то не воспринимает параметры в разделе webds в поле options. Я прописываю ему свои параметры, он их благополучно игнорирует.
Мой конфиг:
1.
2.
3.
4.
5.
6.
7.
8.
9.
10.
11.
12.
13.
14.
15.
16.
17.
18.
19.
20.
21.
22.
23.
24.
25.
26.
27.
28.
29.
<Server>
ServerLog /var/local/yandex/yandex.log
WorkDir /var/local/yandex
<Authorization>
UserName name
UserPassword password
</Authorization>
</Server>
<Collection autostart="yes">
GlobalOptions : UseDirectUrls IgnoreWordFreqs Reindex IgnoreMetaRobots
IndexDir : /var/local/yandex/workindex
TempDir : /var/local/yandex/newindex
<IndexLog>
FileName : /var/local/yandex/index.log
Level verbose moreinfo info debug moredebug
</IndexLog>
<DataSrc id="webds">
Name : mysite
<Webds>
DisallowIndex : /mysite/hotels.view
IgnoreCGIParameters: execution jsessionid
StartUrls : http://www.mysite.ru/mysite/, http://www.mysite.ru/mysite/hotels.view
<IndexedArea>
HttpPrefix : http://www.mysite.ru/mysite/
Options : UseDirectUrls IgnoreWordFreqs Reindex IgnoreMetaRobots
</IndexedArea>
</Webds>
</DataSrc>
</Collection>
Вот что пишет в лог при запуске индексации:
1.
2.
3.
4.
5.
6.
7.
8.
9.
10.
11.
12.
13.
14.
15.
16.
17.
18.
19.
20.
21.
22.
23.
24.
25.
26.
27.
28.
29.
30.
31.
32.
33.
34.
35.
36.
37.
38.
39.
40.
41.
42.
43.
44.
45.
46.
47.
48.
49.
50.
51.
52.
53.
54.
55.
56.
<Collection>
WorkDir : /var/local/yandex
IndexDir : /var/local/yandex/workindex
TempDir : /var/local/yandex/newindex
StopWordFile :
GlobalOptions : Reindex StoreArchive DiscardStopWords ReuseIntID StoreIndexingDate
DocProperty :
Groups :
NavigationSource :
PureTrieFile :
RecognizeLibraryFile :
<IndexLog>
Filename: /var/local/yandex/index.log
Level: MoreConfig MoreWarning MoreInfo MoreDebug
</IndexLog>
<DataSrc>
Name: webds
Config: <Webds>
DisallowIndex : /mysite/hotels.view
IgnoreCGIParameters : execution jsessionid
StartUrls : http://www.mysite.ru/mysite/, http://www.mysite.ru/mysite/hotels.view
<IndexedArea>
HttpPrefix : http://www.mysite.ru/mysite/
Options : UseDirectUrls IgnoreWordFreqs Reindex IgnoreMetaRobots
</IndexedArea>
</Webds>
</DataSrc>
</Collection>
ENT-030-2010.9.0Indexing was started at Mon Jan 23 10:11:53 2012
Working with "webds" data source...
<Webds>
StartUrls : http://www.mysite.ru/mysite/ http://www.mysite.ru/mysite/hotels.view
DefaultHttpPrefix : http://127.0.0.1/
<IndexedArea inherited="yes">
HttpPrefix : http://www.mysite.ru/mysite/
Options : rus RemoveDisconnected ReconnectOnce AllowMetaRobots NoUrlCaseFold AllowPunctBreaks GetFileindnew indmod skipold remmiss ReconnectOnce RemoveDisconnected IndexFollow AllowMetaRobots NoUrlCaseFold use_content_type
</IndexedArea>
<Extensions>
application/msword: .doc
application/pdf: .pdf
application/vnd.ms-excel: .xls
application/vnd.ms-powerpoint: .ppt
application/vnd.oasis.opendocument.text: .odt
application/vnd.openxmlformats-officedocument.wordprocessingml.document: .docx
application/x-shockwave-flash: .swf
audio/mpeg: .mp3
text/html: .html, .htm, .shtml
text/plain: .txt
text/rtf: .rtf
</Extensions>
</Webds>
Mon Jan 23 10:11:53 2012 [Webds] [DEBUG] - Added as start url : http://www.mysite.ru/mysite/.
....
Я так понял что первый он показывает мой Webds, а потом идет второй Webds, в котором он переопределяет параметры. Например у меня задан параметр IgnoreMetaRobots, а в "рабочем" Webds стоит AllowMetaRobots, причем аж два раза.
Что может быть? Сейчас нужно чтобы понимал параметр UseDirectUrls, но думаю если это заработает, все заработает.