|
|
|
Падает репликация
|
|||
|---|---|---|---|
|
#18+
Имеем Informix Dynamic Server 2000 Version 9.21.UC4 на Unixware проблема в том что после падения репликации, которое проявляется еще и в том, что основной сервер перестает отвечать на запросы, в логах следуюющее DR: Sending log 1837 (current), size 20480 pages, 0.02 percent used DR: Sending Logical Logs Completed DR: Primary server operational DR: LBU_PRESERVE turned on while primary Помогает перезапуск обеих Informix'ов. После чего неопределенное время все отлично работает. Да, репликация асинхронная, DRTIMEOUT и DRINTERVAL по 30 сек. На основном бэкапируются логи и периодически бэкап 0 уровеня. На вторичном -- ничего. В логах операционки ничего не нашел, сервера соедены для репликации между собой кроссовым кабелем. Какие идеи? Поменять сетевухи? Но в логах ничего нет, и после перезапуска Informix'ов все работает отлично. Заранее спасибо. ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 20.09.2005, 17:46 |
|
||
|
Падает репликация
|
|||
|---|---|---|---|
|
#18+
На SCO OpenServer были проблемы с тсп Возможно здесь тоже, во всяком случае возможно так кажется Информиксу. Помогает ли периодический перевод основного сервера с primary to standard and наоборот? ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 20.09.2005, 18:58 |
|
||
|
Падает репликация
|
|||
|---|---|---|---|
|
#18+
А что еще в логах написано ? В приведенных вами строках не вижу криминала . Что говорит onstat -g stk когда сарвер перестает отвечать на запросы ? ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 21.09.2005, 00:47 |
|
||
|
Падает репликация
|
|||
|---|---|---|---|
|
#18+
vybegalloА что еще в логах написано ? В приведенных вами строках не вижу криминала . Что говорит onstat -g stk когда сарвер перестает отвечать на запросы ? периодически в логах появляется 00:04:29 DR: ping timeout 00:04:29 DR: Receive error 00:04:29 Checkpoint Completed: duration was 127 seconds. 00:04:29 Checkpoint loguniq 1840, logpos 0x2bf17f0 00:04:31 DR: Turned off on primary server 00:04:31 DR: Cannot connect to secondary server 00:04:41 DR: Primary server connected 00:04:42 DR: Receive error 00:04:42 DR: Failure recovery error (2) 00:04:43 DR: Turned off on primary server 00:04:43 DR: Cannot connect to secondary server 00:04:48 Checkpoint Completed: duration was 2 seconds. 00:04:48 Checkpoint loguniq 1840, logpos 0x2dd51e4 00:04:52 DR: Primary server connected 00:04:53 DR: Receive error 00:04:53 DR: Failure recovery error (2) 00:04:54 DR: Turned off on primary server 00:04:54 DR: Cannot connect to secondary server на вторичном: 00:09:43 DR: ping timeout 00:09:54 DR: Received connection request from remote server when DR is not Off [Local type: Secondary, Current state: FAILED] [Remote type: Primary] 00:10:05 DR: Received connection request from remote server when DR is not Off [Local type: Secondary, Current state: FAILED] [Remote type: Primary] 00:10:16 DR: Received connection request from remote server when DR is not Off [Local type: Secondary, Current state: FAILED] [Remote type: Primary] 00:10:20 Checkpoint Completed: duration was 164 seconds. 00:10:20 Checkpoint loguniq 1840, logpos 0x2b0d374 00:10:27 DR: Turned off on secondary server 00:10:34 DR: Secondary server connected 00:10:35 DR: Failure recovery from disk in progress ... 00:14:06 Checkpoint Completed: duration was 116 seconds. 00:14:06 Checkpoint loguniq 1840, logpos 0x2bf17f0 причем не всегда он входит в ступор. onstat -g stk -- тормознет гляну еще вспомнил, во время одного из зависов, перезапустил основной: #onmode -ky #oninit #onstat -g dri на основном говорит в поле state:off а вторичный state:on #onstat - на основном сказал On-line и blocked CKPT (вроде так пишется) после перезапуска обеих все заработало to zaiets: как помрет попробую PS: время между серверами не синхронизировано, это критично? ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 21.09.2005, 08:59 |
|
||
|
Падает репликация
|
|||
|---|---|---|---|
|
#18+
Обычные траблы с коннектом, начинающиеся со слов ping timeout.. Проверяйте ваш кроссовер кабель или попробуйте соединиться через хаб. ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 21.09.2005, 19:48 |
|
||
|
Падает репликация
|
|||
|---|---|---|---|
|
#18+
unvisible.... между собой кроссовым кабелем. Какие идеи? Поменять сетевухи? Но в логах ничего нет, и после перезапуска Informix'ов все работает отлично. А линк на карточках горит в этот момент? А другие сервисы пинг/телнет/ssh работают в этот момент? ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 22.09.2005, 09:36 |
|
||
|
Падает репликация
|
|||
|---|---|---|---|
|
#18+
Журавлев Денис unvisible.... между собой кроссовым кабелем. Какие идеи? Поменять сетевухи? Но в логах ничего нет, и после перезапуска Informix'ов все работает отлично. А линк на карточках горит в этот момент? А другие сервисы пинг/телнет/ssh работают в этот момент? а фиг его знает, но пинги хлдят, буду пробовать сетевухи менять. ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 22.09.2005, 13:22 |
|
||
|
|

start [/forum/topic.php?fid=44&tid=1608906]: |
0ms |
get settings: |
8ms |
get forum list: |
14ms |
check forum access: |
3ms |
check topic access: |
3ms |
track hit: |
81ms |
get topic data: |
9ms |
get forum data: |
3ms |
get page messages: |
36ms |
get tp. blocked users: |
1ms |
| others: | 225ms |
| total: | 383ms |

| 0 / 0 |
