powered by simpleCommunicator - 2.0.59     © 2025 Programmizd 02
Целевая тема:
Создать новую тему:
Автор:
Закрыть
Цитировать
Форумы / Unix-системы [игнор отключен] [закрыт для гостей] / Яндекс.Сервер игнорирует параметры индексации
1 сообщений из 1, страница 1 из 1
Яндекс.Сервер игнорирует параметры индексации
    #37626640
jk-programmer
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Гость
Добрый день. Возникла такая проблема при работе с Яндекс.Сервер. Пробую использовать его для поиска по сайту. Операционная система - Open SUSE. Сервер запускается, создает индексы, ищет по созданным индексам. Но вот обнаружилась проблема в индексаторе - он почему-то не воспринимает параметры в разделе webds в поле options. Я прописываю ему свои параметры, он их благополучно игнорирует.

Мой конфиг:

Код: xml
1.
2.
3.
4.
5.
6.
7.
8.
9.
10.
11.
12.
13.
14.
15.
16.
17.
18.
19.
20.
21.
22.
23.
24.
25.
26.
27.
28.
29.
<Server>
	ServerLog /var/local/yandex/yandex.log
	WorkDir /var/local/yandex  
	<Authorization>    
		UserName name    
		UserPassword password
	</Authorization>
</Server>
<Collection autostart="yes">
	GlobalOptions : UseDirectUrls IgnoreWordFreqs Reindex IgnoreMetaRobots
	IndexDir : /var/local/yandex/workindex
	TempDir : /var/local/yandex/newindex    
	<IndexLog>
		FileName : /var/local/yandex/index.log
		Level verbose moreinfo info debug moredebug
	</IndexLog>	
	<DataSrc id="webds">
		Name : mysite
		<Webds>
			DisallowIndex : /mysite/hotels.view
			IgnoreCGIParameters: execution jsessionid
			StartUrls : http://www.mysite.ru/mysite/, http://www.mysite.ru/mysite/hotels.view
			<IndexedArea>
				HttpPrefix : http://www.mysite.ru/mysite/				
				Options : UseDirectUrls IgnoreWordFreqs Reindex IgnoreMetaRobots
			</IndexedArea>
		</Webds>
    </DataSrc>
</Collection>




Вот что пишет в лог при запуске индексации:
Код: xml
1.
2.
3.
4.
5.
6.
7.
8.
9.
10.
11.
12.
13.
14.
15.
16.
17.
18.
19.
20.
21.
22.
23.
24.
25.
26.
27.
28.
29.
30.
31.
32.
33.
34.
35.
36.
37.
38.
39.
40.
41.
42.
43.
44.
45.
46.
47.
48.
49.
50.
51.
52.
53.
54.
55.
56.
<Collection>
	             WorkDir : /var/local/yandex
	            IndexDir : /var/local/yandex/workindex
	             TempDir : /var/local/yandex/newindex
	        StopWordFile :
	       GlobalOptions : Reindex StoreArchive DiscardStopWords ReuseIntID StoreIndexingDate
	         DocProperty :
	              Groups :
	    NavigationSource :
	        PureTrieFile :
	RecognizeLibraryFile :
	<IndexLog>
	    Filename: /var/local/yandex/index.log
	    Level: MoreConfig MoreWarning MoreInfo MoreDebug
	</IndexLog>
	<DataSrc>
	    Name: webds
	    Config: <Webds>
			DisallowIndex : /mysite/hotels.view
    		IgnoreCGIParameters : execution jsessionid
			StartUrls : http://www.mysite.ru/mysite/, http://www.mysite.ru/mysite/hotels.view
			<IndexedArea>
				HttpPrefix : http://www.mysite.ru/mysite/
				Options : UseDirectUrls IgnoreWordFreqs Reindex IgnoreMetaRobots
			</IndexedArea>
		</Webds>
	</DataSrc>
</Collection>

ENT-030-2010.9.0Indexing was started at Mon Jan 23 10:11:53 2012

Working with "webds" data source...
<Webds>
    StartUrls : http://www.mysite.ru/mysite/ http://www.mysite.ru/mysite/hotels.view
    DefaultHttpPrefix : http://127.0.0.1/
    <IndexedArea inherited="yes">
        HttpPrefix : http://www.mysite.ru/mysite/
        Options :  rus RemoveDisconnected ReconnectOnce AllowMetaRobots NoUrlCaseFold AllowPunctBreaks GetFileindnew indmod skipold remmiss ReconnectOnce RemoveDisconnected IndexFollow AllowMetaRobots NoUrlCaseFold use_content_type
    </IndexedArea>
    <Extensions>
        application/msword: .doc
        application/pdf: .pdf
        application/vnd.ms-excel: .xls
        application/vnd.ms-powerpoint: .ppt
        application/vnd.oasis.opendocument.text: .odt
        application/vnd.openxmlformats-officedocument.wordprocessingml.document: .docx
        application/x-shockwave-flash: .swf
        audio/mpeg: .mp3
        text/html: .html, .htm, .shtml
        text/plain: .txt
        text/rtf: .rtf
    </Extensions>
</Webds>

Mon Jan 23 10:11:53 2012 [Webds] [DEBUG] - Added as start url : http://www.mysite.ru/mysite/.
....



Я так понял что первый он показывает мой Webds, а потом идет второй Webds, в котором он переопределяет параметры. Например у меня задан параметр IgnoreMetaRobots, а в "рабочем" Webds стоит AllowMetaRobots, причем аж два раза.

Что может быть? Сейчас нужно чтобы понимал параметр UseDirectUrls, но думаю если это заработает, все заработает.
...
Рейтинг: 0 / 0
1 сообщений из 1, страница 1 из 1
Форумы / Unix-системы [игнор отключен] [закрыт для гостей] / Яндекс.Сервер игнорирует параметры индексации
Найденые пользователи ...
Разблокировать пользователей ...
Читали форум (0):
Пользователи онлайн (0):
x
x
Закрыть


Просмотр
0 / 0
Close
Debug Console [Select Text]